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ADN et proteines ou peptides specifiques des 
bacteries de l'espece Neisseria meningitidis, leurs 
procedes d'obtention et leurs applications biologiques. 

5 L' invention est relative aux ADN, et aux proteines 

et peptides, specifiques des bacteries de l'espece 
Neisseria meningitidis (ci-apres en abrege Nm), a leur 
procede d'obtention et a leurs applications biologiques, 
en particulier pour la prevention et la detection 

10 d' infections a meningocoques et de meningites. 

On sait que Nm constitue I'un des principaux agents 
de la meningite cerebrospinal . 

Des etudes menees aux Etats-Unis ont montre que de 5 
a 10% de la population sont porteurs asymptomatiques de 

15 souche(s) de Nm. Les facteurs de transmission de Nm sont 
mal connus. Pour une proportion des personnes infectees, 
Nm penetre le flux sanguin, ou elle peut provoquer une 
meningococceraie et/ou progresse dans le flux 
cerebrospinal pour provoquer une meningite. Sans 

20 traitement antibiotique rapide, 1» infect ion peut se 
developper de maniere fulgurante et devenir raortelle. 

Comparfee aux autres pathogenes, Nm presente la 
caracteristique de pouvoir franchir la barriere hemato- 
enceplialique afin de coloniser les meninges. L ' etude de 

25 la pathogenicite de Nm est done non seulement importante 
dans le cadre de la mfeningite, mais aussi dans le cadre 
de toute maladie touchant le cerveau. 

On congoit alors l'interet de disposer d'outils 
specifiques de cette espdee bacterienne pour les 

30 applications envisagees ci-dessus. 

Nm est genfetiquement tres proche des bacteries de 
l'espece Neisseria gonorrhoeae (ci-apres en abr6ge Ng) et 
de l'espece Neisseria lactamica (ci-apres en abrege Nl). 
Leur pathogenicity est toutefois tres differente. 
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Nm colonise le nasopharynx, puis traverse 
1' epithelium pharynge pour envahir l'espace sous- 
muqueux, etant alors responsable de septicemic et de 
meningite . 

5 Ng est surtout responsable d' infections localisees 

du tractus genito-urinaire. Elle colonise la muqueuse 
genitale, puis traverse 1' epithelium, envahit ensuite le 
sous-epithelium ou elle se multiplie et est responsable 
d'une forte reaction inflammatoire. Des infections 

10 gonococciques disseminees sont possibles, mais restent 
rares et sont le fait de seulement certaines souches. 
Quant a Nl, on considfere gu'il s'agit d'une souche non 
pathogene, 6tant donne qu'elle n'est pas responsable 
d' invasion localisee ou generale. 

15 Ainsi, une premiere consideration amene a prendre en 

compte le fait que Nm et Ng , tout en §tant des bacteries 
tres proches, presentent des pouvoirs pathog^nes 
dif ferents. 

Le genome de ces bacteries etant fortement 
20 homologue, seules des parties limitees du genome de Nm et 
de Ng doivent coder pour des facteurs de virulence 
specif iques, responsables de leur pathogeneses 

II est clair que Nm prfesente par rapport a Ng des 
sequences d'ADN qui lui sont specif iques et qui doivent 
25 intervenir au niveau de l f expression de son pouvoir 
pathogene specif ique. 

I/espece Nm est subdivisee en serogroupes bases sur 
la nature des polysaccharides capsulaires. 

Au moins 13 serogroupes ont ete definis, parxni 
30 lesquels les serogroupes A, B et C sont responsables 
d 1 environ 90% des cas de meningites, Les groupes A et C 
sont observes dans les formes epid&miques de la maladie. 
Le groupe B est le serogroupe le plus couramment isole en 
Europe et aux Etats-Unis. 
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La capsule, presente chez Nm et absente chez Ng, a 
servi de base pour 1 ' elaboration de vaccins anti- 
meningite raeningococcique. 

Les polysaccharides de la capsule de Nm ont ete 
5 utilises pour 1 ' elaboration d'un vaccin qui s'est montre 
efficace pour prevenir chez les adultes la meningite 
provoquee par les meningocoques de serogroupes A, C, W135 
et Y. 

Cependant, le polysaccharide de Nm groupe C s'est 
10 revele faiblement immunogene chez les enfants de raoins de 
deux ans, alors que le polysaccharide de Nm groupe B est 
non immunogene chez l'homme et partage des epitopes avec 
des glycoproteines d' adhesion presentes dans les cellules 
neuronales humaines. 
15 ii n' exist e done pas de vaccin universel capable de 

prevenir les infections provoquees par 1' ensemble des 
serogroupes des meningocoques et capable de repondre a la 
variability antigenique propre aux pathogenes bacteriens 
en general et a Nm en particulier. 
20 En raison de la reactivite croisee du polysaccharide 

groupe B de Nm avec les antigenes humain, de la 
multiplicite des serogroupes et de la variability 
antigenique de Nm, les strategies proposees a ce jour ne 
peuvent conduire a un vaccin efficace dans toutes les 

25 situations. 

Les recherches se sont alors concentrees sur 1' etude 
d' elements caracteristigues responsables de la 
specif icite de la pathogenese meningococcique. 

La plupart des genes qui ont ete etudies dans l'une 
30 quelconque des deux bacteries Nm ou Ng possedent leur 
homologue dans la deuxieme bacterie. 

De la meme maniere, la plupart des facteurs de 
virulence jusqu'ici identifies dans Nm ont une 
contrepartie dans Ng, e'est-a-dire la piline, les 
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proteines PilC, les proteines d'opacite et les recepteurs 
de la lactoferrine et de la transf errine. 

Les attributs specif iques des raeningocoques 
caracterises dans I'art anterieur sont la capsule, les" 
5 prot&ines Frp analogues aux toxines RTX, les proteines de 
la membre externe Opc, la peroxydase glutathione, la 
porine PorA et le gene rotamase. 

Parmi ceux-ci, seule la capsule est invariablement 
presente dans les souches virulentes de Nm. Cependant, de 
10 nombreux pathogenes extra-cellulaires possedent une 
capsule sans pour autant traverser la barriSre hemato- 
encephalique . 

Des attributs non encore identifies doivent done 
etre responsables de la specif icite de la pathogfenese 

15 meningococcal- Ces attributs sont vraiserablablement 
codes par des sequences d'ADN presentes parmi les 
meningocoques roais absentes chez les gonocoques. 

Les inventeurs ont d6veloppe une nouvelle voie 
d'approche basee sur I'isolement soustractif des genes 

20 Nm-specif iques , ces genes devant etre lies a la 
pathogenese specif ique de Nm, et, plus particulierement 
au franchissement de la barriere hemato-encephalique. 

La methode soustractive developp^e dans I 1 art 
anterieur a about! a la production de marqueurs 

25 epidemologiques pour certains isolats de Nm. Ces 
marqueurs sont d'une utilite limitee : ils ne couvrent 
pas 1' ensemble des serogroupes de l'espece Nm. 

Par contraste avec ces 6tudes, les travaux des 
inventeurs ont conduit, en confrontant Nm a 1 ' ensemble du 

30 chromosome de Ng, cisaille de raaniere al6atoire, k la 
mise au point de raoyens pour doner 1' ensemble des ADN 
presents chez Nm et absents chez Ng, fournissant ainsi 
des outils de haute specificity vis-a-vis de Nm et 
permettant ainsi de rSpondre pour la premiere fois a la 

35 variability gen6tique de l'espece. 
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Les termes "present" et "absent", tel qu' utilises 
dans la description et les revendications en rapport avec 
les ADN d'une souche, ou leurs produits d 1 expression, 
sont apprecies par rapport a des conditions d ' hybridation 
5 identiques ( 16h a 65 -C, avec NaP0< 0,5m, pH 7,2; EDTA-Na 
0,001M, 1%,1% d'albumine de serum bovin et 7% de 
dodecylsulfate de sodium), en utilisant une meme sonde et 
une meme intensite de marquage de la sonde, une meme 
quantite d'ADN chromosomique et un meme element de 
10 comparaison (ADN chromosomique de la souche homologue). 
Ainsi, on considere que 1 1 ADN est present lorsque le 
signal obtenu avec la sonde est pratiquement le meme que 
celui obtenu avec la souche de reference. 

En revanche, on considere que 1 1 ADN est absent 
15 lorsque ce signal apparait tres faible. 

Une deuxieme consideration sur les pathogenicity de 
Nm et de Ng conduit a prendre en compte leur aptitude 
commune a coloniser et a penetrer la rauqueuse puis a 
envahir l'espace sous-epithelial de cette derniere. II 
20 est fort vraissemblable que ce processus implique des 
facteurs de virulence communs aux deux pathogenes. A cet 
egard, on sait qu'un certain nombre de facteurs de 
virulence ont ete deja identifies chez Nm et chez Ng, 
comme les prolines pili, PilC, les proteines d'opacite, 
25 les proteases d'IgA, les prolines de liaison a la 
transferrine et a la lactoferrine, et des 
lipooligosaccharides . 

La demarche des inventeurs s'est done 6tendue a la 
recherche de regions de Nm, sp6gifiques de Nm et de Ng, 
30 mais absentes chez l'espece non pathogene Nl, et d'une 
maniere generale a la recherche, par les moyens mis au 
point conformement a 1' invention, de regions 
chromosomiques d'ADN et de leurs produits d' expression, 
specif iques d'une espece donnee. 
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L 1 invention a done pour but de fournir des ADN de Nm 
specifiques de son pouvoir pathogene et des moyens pour 
les obtenir, notamment en elaborant des banques formees 
exclusivement de ces ADN Nm-specif iques- 
5 Elle vise egalement les produits derives de ces 

sequences d'ADN. 

1/ invention vise Sgaleraent la mise a profit des 
caracteres specif ique et exhaustif de ces banques pour 
elaborer des outils utilisables notamment en diagnostic, 
10 therapie et prevention. 

Les ADN de 1' invention sont caracterises en ce qu'il 
s'agit de tout ou partie de genes, avec leur phase de 
lecture, presents chez Neisseria meningitidis, mais 
absents soit chez Neisseria gonorrhoeae, soit chez 
15 Neisseria lactamica, a 1' exception des genes impliqu6s 
dans la biosynthese de la capsule polysaccharidique , 
frpA, frpC, opc, por A, rotamase, de la sequence IS1106, 
des IgA proteases, de la pilline, de pilC, des protfeines 
qui lient la transferrine et des proteines d'opacite. 
20 Comme precise plus haut, les tennes ,f presents' r et 

' 1 absents * * sont apprecies par rapport aux conditions 
d 1 hybridation telles qu'utilisees dans les Southern blots 
decrits dans les exemples et rappel6es plus haut. 

On notera que ces ADN englobent les variants des 
25 lors qu'ils expriment une fonction propre a l'espece Nm, 
plus particulierement un phenotype retrouve uniquement 
chez Nm ou en commun exclusivement avec Ng. 

Selon un aspect majeur, ces ADN sont specifiques de 
la pathog£necite de Neisseria meningitidis et ce, en 
30 depit de la variabilite gen6tique de cette espece. 

Selon un mode de realisation de 1' invention, lesdits 
ADN sont specifiques de Nm par rapport & Ng. 

Plus particulierement, les ADN Nm-specif iques sont 
absents de Neisseria lactamica et de Neisseria cinerea. 
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De fa<?on surprenante, la majorite des differences 
genet iques entre les souches de meningocoques et celles 
de gonocoques apparaissent regroupees en regions 
distinctes, qui correspondraient a des ilots de 
5 pathogenicities comme precedemment deer it pour E. coll et 
y. pestls. 

Ainsi, dans une disposition preferee de 1' invention, 
ces ADN sont egalement caracterises en ce qu'ils 
comprennent une ou plusieurs sequence(s), telle(s) que 

10 presente(s) sur le chromosome de Neisseria meningitidis 
Z2491 entre tufA et pllT, ou region 1 du chromosome, 
et/ou la ou les sequence(s) capable(s) de s'hybrider avec 
la ou les sequence* s) ci-dessus, sous reserve d'etre 
specif ique( s ) de Neisseria meningitidis. 

15 Par "specifique" , on designe dans la description et 

les revendications les sequences de nucleotides qui ne 
s'hybrident qu'avec celles de Nra, dans des conditions 
d f hybridation donnees dans les exeraples et rappelees plus 
haut . 

20 On notera a cet egard que, de maniere generale, 

lorsqu'on fait reference dans la description et les 
revendications a "tout ou partie" d'une sequence, cette 
expression doit etre appreciee par rapport a la 
specif icite definie ci-dessus, 

25 De meme, tout ou partie d'un peptide, ou un fragment 

d'un peptide ou d'un anticorps designe un produit 
presentant les propri6tes biologiques respectivement du 
peptide natif ou de 1' anticorps forme contre le peptide. 
Dans la region 1, sont regroupes des genes de la 

30 capsule de Neisseria meningitidis. 

Des ADN de ce type pr6sentent une sequence 
correspondant, pour tout ou partie , a SEQ ID N # 9, 13, 22 
ou 30, et/ou a toute sequence se situant a plus ou moins 
20 kb de ces SEQ ID sur le chromosome d'une souche de Nm, 

35 et/ou presentent une sequence capable de s'hybrider avec 



FEU1LLE DE REMPLACEMENT (REGLE 2§) 



BNSDOC1D: <WO 9602£a7A2_L> 



WO 98/02547 8 PCT/FR97/01295 



au moins un fragment de l'une quelconque de ces 
sequences . 

Dans une autre disposition preferee de 1' invention, 
ces ADN sont 6galement caracterises en ce qu'ils sont 
5 const itues par une ou plusieurs sequence(s), telle(s) que 
presente(s) sur le chromosome de Neisseria meningitidis 
Z2491 entre pilQ et A740, ou region 2 du chromosome, 
et/ou la ou les sequence(s) capable(s) de s'hybrider 
avec la ou les sequence(s) ci-dessus, sous reserve d'etre 
10 specif ique(s) de Neisseria meningitidis. 

Des ADN selon cette disposition presentent une 
sequence correspondant, pour tout ou partie, a SEQ ID 
N # l, 2, 4, 6, 7, 10, 15, 31 ou 34, et/ou a toute sequence 
se situant a plus ou moins 20 kb de ces SEQ ID sur le 
15 chromosome d'une souche de Nm, et/ou presentent une 
sequence capable de s'hybrider avec au moins un fragment 
de 1 ' une quelconque de ces sequences . 

L' invention vise tout specialement tout ou partie de 
la sequence d 'ADN SEQ ID N # 36 de 15620 pb, et les 
20 sequences correspondant aux cadres ouverts de lecture SEQ 
ID W37, SEQ ID N* 38, SEQ ID N* 39, SEQ ID N* 40, SEQ ID 
N' 41, SEQ ID N* 42, SEQ ID N # 43, SEQ ID N* 44 et 
SEQ ID N* 45. 

Dans encore une autre disposition preferee de 
25 i« invention, ces ADN sont egalement caracterises en ce 
gu'ils sont constitu6s par une ou plusieurs sequence(s), 
telle(s) que presente(s) sur le chromosome de Neisseria 
meningitidis 22491 entre argF et opaB, ou region 3 du 
chromosome, et/ou la ou les sequence(s) capable(s) de 
30 s'hybrider avec la ou les s6quence(s) ci-dessus, sous 
reserve d'etre specifique(s) de Neisseria meningitidis. 

Des ADN selon cette disposition sont caracterises en 
ce qu'ils presentent une sequence correspondant pour tout 
ou partie a SEQ ID N*8, 21, 23, 25, 26, 28, 29, 32 ou 35, 
35 et/ou a toute sequence se situant a plus ou moins 20 kb 
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de ces SEQ ID sur le chromosome d'une souche de Nm, 
et/ou, presentent une sequence capable de s'hybrider avec 
au moins un fragment de l'une quelconque de ces 
sequences . 

5 Les regions 1. 2, 3. identifiers ci-dessus. 

presentent une forte proportion de sequences Neisseria 
meningitidis specif iques, et entrent egalement dans le 
cadre de 1' invention. 

D'autres ADN representatif s de la specif icite vis-a- 

10 vis de Neisseria meningitidis presentent une ou plusieurs 
sequences telle(s) que presente(s) sur le chromosome de 
Neisseria meningitidis Z2491, mais ne font pas partie des 
regions 1, 2, 3 definies ci-dessus. 

De tels ADN comprennent une ou plusieurs sequences 

15 correspondant pour tout ou partie a SEQ ID n*3, 5, 11, 
12, 14, 16, 18, 19, 20, 24, 27 ou 33, et/ou a toute 
sequence se situant a plus ou moins 20 kb de ces SEQ ID 
sur le chromosome d'une souche de Nm, et/ou presentent 
une sequence capable de s'hybrider avec de telles 

20 sequences. 

Compte tenu des applications particulierement 
visees, 1' invention conceme plus specialement les ADN 
ci-dessus impliques dans la pathogenese de l'organisme 
bacterien. 

25 Elle vise, en particulier, les ADN repondant a au 

moins l'une des caracterisations donnees ci-dessus, et 
codant pour une proteine exportee au-dela de la membrane 
cytoplasmique et/ou dont tout ou partie de leur sequence 
correspond a la region conservee desdits ADN. 

30 Ainsi, selon un autre mode de realisation de 

1' invention, les ADN sont communs avec ceux de Ng, mais 
sont absents de chez Nl. 

II s'agit plus specialement d'ADN presents sur la 
region 4 (arg J a reg F) ou sur la region 5 (marqueur 

35 lambda 375 a pen A) sur le chromosome de Nm Z2491 et/ou 
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capables de s'hybrider avec lesdits ADN presents, sous 
reserve d'Stre specif iques de Nm et de Ng par rapport a 
Nl. 

Par " specif ique de Nm et de Ng par rapport a Nl" ,~ 
5 on designe des ADN qui s'hybrident avec les ADN de Nm et 
de Ng dans les conditions d' hybridation des exemples 
(voir en particulier l'exemple 4). 

Les ADN des regions 4 et 5, et ceux capables de 
s'hybrider avec ces ADN, sous reserve d'exprimer les 
10 fonctions propres a Nm, presentent I'avantage 
d'intervenir de maniere majeure dans la virulence de Nm, 
en etant impliques dans l'6tape de colonisation et de 
penetration initiales et dans la dissemination 

septicemique . 

15 Selon d'autres dispositions, 1' invention vise les 

vecteurs de transfert et d 1 expression, tels que 
plasmides, cosmides ou bacteriophages, comportant au 
moins un ADN tel que defini ci-dessus. 

Elle vise aussi les cellules hotes telles que 

20 transformees par au raoins un ADN tel que defini ci- 
dessus. 

D'autres cellules hotes de l f invention comportent 
des genes ou des fragments de genes specifiques de Nm et 
sont caract6risees en ce que leur chromosome est dfelete 
25 d'au moins un ADN selon 1' invention, en particulier d'un 
ADN responsable de la pathogenicity. II s'agit plus 
specialement de cellules bacteriennes , notamment de Nm. 

L' invention a 6galement pour objet les ARN dont la 
sequence correspond pour tout ou partie a la 
30 transcription d 1 au moins une sequence ou fragment de 
sequence d* ADN tel que d6fini ci-dessus. 

Les acides nucl&iques anti-sens des ADN tels que 
d&finis ci-dessus, ou de fragments de ces ADN, font 
egalement partie de 1' invention. 
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Ces acides nucleiques anti-sens portent le cas 
echeant au moins un substituant telle qu'un groupe 
methyle et/ou un groupe glycosyle. 

D f autres produits entrant dans le champ de 
5 1" invention sont constitues par des polypeptides. 

Ces polypeptides sont caracterises en ce gu'ils 
presentent un enchainement d 1 acides amines correspondant 
a tout ou partie d'une sequence telle que codee par les 
acides nucleiques definis dans ce qui precede, ou telle 
10 que deduite des sequences de ces acides nucleiques. 

II s f agit avantrageusement de polypeptides 
correspondant a tout ou partie de polypeptides exportes 
au-dela de la membrane cytoplasmique, plus specialeraent 
de polypeptides correspondant a tout ou partie de ceux 
15 tels que codes par une region conservee. 

En variante, les polypeptides de 1* invention peuvent 
etre modifies par rapport a ceux correspondant aux 
sequences d 1 acides nucleiques, et ce de maniere a etre 
particulierement adaptes pour une application donnee, en 
20 particulier une application vaccinale. 

Par modification, on entend toute alteration, 
deletion, substitution chimique, des lors qu'elle 
n'affecte pas les proprietes biochimiques des 
polypeptides natifs correspondents , plus specialement des 
25 proteines fonctionnelles telles qu'exportees au niveau du 
periplasme et de la membrane externe. 

D'autres produits conformes a 1" invention sont 
constitues par les anticorps diriges contre les 
polypeptides ci-dessus. 
30 L * invention vise ainsi les anticorps polyclonaux, 

ainsi que les anticorps monoclonaux, caracterises en ce 
qu'ils reconnaissent au moins un epitope d'un polypeptide 
tel qu'evoque plus haut. 

Elle vise egaleraent les fragments de ces anticorps, 
35 plus particulierement les fragments Fv, Fab, Fab' 2. 
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Les anti-anticorps capables de reconnaitre les 
anticorps definis ci-dessus, ou leurs fragments, selon 
une reaction de type antigene-anticorps, font egalement 
par tie de 1* invent ion. 
5 Conformtment a l 1 invention, les differents produits 

consideres ci-dessus sont obtenus par voie de synthese 
et/ou biologique en operant selon les techniques 
classiques. 

Les acides nucleiques peuvent: etre egalement obtenus 
10 a partir de banques constitutes d 1 ADN Nm- specif iques, 
telles qu'elaborees selon une technique soustractive, 
cette technique comprenant : 

- le melange de deux populations d ' ADN, 

- la realisation d'au moins une iteration 
15 d' hybridation-amplification soustractive, et 

- la recuperation du ou des ADN souhaites, 
suivie le cas 6ch6ant de leur purification avec 
1 ' elimination des sequences redondantes. 

Conformement d 1* invention, les deux 
20 populations d* ADN proviennent respectivement d ! une souche 
de Neisseria meningitidis, dite souche de reference, pour 
laquelle la banque specif ique doit £tre constitute, et 
d'une souche de Neisseria, dite souche de soustraction, 
presentant une homologie en sequences primaires d'ADN 
25 superieure a environ 70% avec la souche de Neisseria 
meningitidis, les sequences d'ADN des souches de 
soustraction et de reference etant telles qu'obtenues 
respectivement par cisaillement aleatoire, et par clivage 
par une endonuclease de restriction capable de produire 
30 des fragments de taille inferieure a environ Ikb. 

L' invention vise en particulier un proced6 
d'obtention de banques d'ADN Neisseria meningitidis 
specif iques, comportant les etapes de : 

- cisaillement aleatoire de 1 1 ADN chromosomique 
35 d'une souche Neisseria gonorrhoeae, dite souche de 
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soustraction, notanunent par passages repetes a travers 
une seringue, 

- clivage de l'ADN chromosomique d'une souche 
de Neisseria meningitidis, dite souche de reference, de 

5 preference par une enzyme de restriction produisant des 
fragments de taille inferieure a Ikb environ, 

- ligature des fragments d ' ADN de la souche de 
reference, clives par 1' enzyme de restriction, avec des 
amorces oligonucleotidiques appropriees, 

10 - realisation d'une iteration d 1 hybridation- 

amplification soustractive par : 

. melange des deux populations d f ADN dans des 
conditions appropriees pour 1 r hybridation des sequences 
homologues, puis 

15 . amplification des fragments auto-reanneles et 

recuperation de ces fragments, 

. digestion de ces fragments par une enzyme de 
restriction, et re-ligature a des amorces 
oligonucleotides suivie d'une 

20 - purification de 1 ' ADN ligature, et le cas 

echeant, d'une nouvelle iteration d T hybridation 
soustractive, comportant le melange de fragments d'ADN de 
Neisseria gonorrhoeae cisaill6 comme indique ci-dessus 
avec les fragments d'ADN de Neisseria meningitidis issus 

25 de 1' iteration precedente, suivi, si on le souhaite du 
clonage des ADN de la banque. 

Les amorces utilis6es sont des amorces 
oligodesoxynucleotidiques adaptfees a 1 1 endonuc!6ase de 
restriction utilisee et permettant une insertion dans un 

30 site de clonage, tel que le site EcoRI du plasmide 
pBluescript. On choisira avantageusement de telles 
amorces parmi les oligodesoxynucleotides references dans 
le listing de sequence sous SEQ ID n # 36 a 45. 
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Les banques ainsi obtenues sont formees d'ADN 
specif iques des meningocoques et absents chez les 
gonocoques . 

La specificite des ADN a ete verifiee comme expose - 
5 dans les exemples, a chaque iteration par Southern blots, 
avec des genes communs a la souche de soustraction et a 
la souche de reference, ou avec 1 ' ADN total de chacune 
des souches digere par une endonuclease de restriction, 
telle que Clal. 

10 A chaque iteration, a egalement ete verifiee 

1 ' exhaustivite de la banque d 1 ADN par Southern blotting 
avec des sondes connues pour etre specif iques de la 
souche de reference, a savoir pour Neisseria 
meningitidis, les genes frp, opc, rotamase, notamment. 

15 Les experiences realisees ont montre que les banques 

obtenues selon le procede de 1 ' invention sont d6pourvues 
des genes presentant une homologie significative avec des 
especes de Neisseria autre que Neisseria meningitidis, 
par exemple les genes, ppk ou pilCl, et ce gfeneralement , 

20 en seulement 2 ou 3 iterations. 

Si necessaire, deux voies, non exclusives l'une de 
l 1 autre, peuvent etre empruntfees. 

em© 

II est possible de proceder a une (n+1) 
iteration, en utilisant l'ADN de l f iteration n conune 
25 population d'ADN de la souche de r6f6rence. 

En variante, on realise une deuxieme banque, 
independante de la premiere, avec une enzyme de 
restriction de specificite dif f erente de celle utilisfee 
dans la premiere banque, par exemple Mbol. 
30 Dans tous les cas, il est preferable de conserver 

chacun des produits issus de chacune des iterations 
realisees . 

L 1 invention vise egalement 1 'utilisation de la 
technique soustractive d^crite ci-dessus pour obtenir des 
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banques d'ADN cominuns entre Nm et Ng, mais specif iques 
par rapport a Nl. 

On constitue avantageuseraent trois banques 
differentes. dont deux par digestion de i'ADN 
5 chromosomique de Nm par Hbol et Tsp5091, et la 
troisieme , par digestion de l'ADN chromosomique de Nm 
avec Mspl. Deux series de soustraction permettent de 
recuperer des ADN presentant la specificite recherchee, 
comme decrit dans les exemples. 
10 Le procede d'obtention de ces banques et les banques 

elles-memes font egalement partie de 1' invention. 

On observera que, de maniere generale, le procede de 
1' invention est applicable pour l'obtention de banques 
d'ADN specif iques d'une espece de cellule donnee ou d'un 
15 variant donne d'une meme espece, des lors qu'il existe 
une autre espece ou un autre variant proche genoraiquement 
et exprimant des pouvoirs pathogenes differents. 

En appliquant le procede de 1' invention, on 
constituera avantageuseraent des banques d'ADN specif iques 
20 d'especes donnees de cryptocoques , d* Haemophilus, de 
pneumocoques ou encore d' Escherichia colt, ou plus 
generalement de tout agent bacterien appartenant a la 
meme espece et disposant de pathovars differents. 

De meme, a partir de ces banques, 1' invention 
25 fournit les moyens de disposer de facteurs de virulence 
specif iques d'une espece ou d'un variant donne. 

De telles banques constituent done des outils 
presentant un interet majeur pour disposer d'attributs 
responsables de la specificite d'un pathogene, cette 
30 application etant plus specialement illustree 
conformement a 1' invention par l'obtention de banques 
renfermant les attributs responsables de la specificite 
de la pathogenese meningococcique. 

L ' etude des produits de 1' invention. acides 
35 nucleiques. polypeptides et anticorps, a permis de mettre 



FEUIUi DE REMPLACEMENT (REGLE 2© 



BNSOODfr <WO__9602S47A2.l_> 



WO 98/02547 



PCT/FR97/01295 



en evidence une specificity absolue vis-a-vis de 
Neisseria meningitidis, quelle que soit la souche et sa 
variability. 

Ces produits sont done particulierement appropries 
5 pour le diagnostic ou la prevention des infections et 
m6ningites provoqufees par Neisseria meningitidis, que ce 
soit chez l'adulte ou 1* enfant et quel que soit le 
serogroupe de la souche en cause. 

La methode de diagnostic, selon 1' invention, d'une 
10 infection meningococcigue , et plus particulierement de la 
meningite meningococcique, par mise en Evidence de la 
presence de Neisseria meningitidis dans un echantillon a 
analyser, est caracterise par les Stapes de : 

- mise en contact, d'un Echantillon a analyser, a 
15 savoir un echantillon biologique ou une culture 

cellulaire, avec un reactif elabor6 a partir d'au moins 
un acide nuclSique tel que defini ci-dessus, le cas 
echeant sous forme de sonde nucleotidique ou d' amorce, ou 
en variante a partir d'au moins un anticorps, ou un 
20 fragment d ! anticorps, tel que dfefini ci-dessus, dans des 
conditions permettant respectivement une hybridation ou 
une reaction de type antigene-anticorps, et 

- revelation du prodiiit de reaction eventuellement 
forme. 

25 Lorsque le reactif est elabor§ a partir d'un acide 

nuclfeique, celui-ci peut se presenter sous forme de sonde 
nucleotidique dans laquelle l 1 acide nuclfeique, ou un 
fragment de ce dernier, est marqu6 afin de permettre sa 
revelation. Des marqueurs appropries comprennent des 

30 marqueurs radio-actifs, f luorescents , enzymatiques ou 
luminescents . 

En variante, l f acide nucleique est inclus dans une 
cellule bote, utilisee comme reactif. 
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Dans ces differentes formes, l'acide nucleique esc utilise 
tel quel ou sous forme d'une composition avec des vehicules 
inertes. 

Lorsque le reactif est elabore a partir d'un anticorps, ou 
5 d'un fragment d' anticorps, celui-ci peut etre marque aux fins 
de revelation. Le plus couramment, on utilise un marqueur 
fluorescent, enzymatique, radio-actif ou luminescent. 

L'ancicorps, ou le fragment d' anticorps utilise, ie cas 
echeant, marque, peut etre utilise tel quel ou sous forme d'une 
10 composition avec des vehicules inertes. 

L' echantillon utilise dans 1 ' itape de mise en contact est 
un echantillon biologique, issu d'un mammifere, tel que liquide 
cephalo-rachidien, urine, sang, salive. 

L'etape de revelation est realisee dans des conditions 
15 permettant de mettre en evidence le produit de reaction 
lorsqu'il s'est forme. Des moyens classiques mettent en oeuvre 
des reactions de fluorescence, luminescence, colorees, radio- 
actives ou encore des techniques d 1 autoriadographie . II est 
egalement possible de quantifier le produit. 
20 Les produits marques, acides nucleiques et anticorps font 

egalement partie en tant que produits nouveaux de 1 ■ invention. 

La methode definie ci-dessus peut etre appliquee au 
diagnostic d'une reaction immunitaire specif ique d'une 
infection meningococcique . 
25 On utilise alors comme reactif un polypeptide conforme a 

1' invention, tel que code par lesdites sequences d'acides 
nucleiques, correspondant au produit natif, ou un polypeptide 
modifie, mais possedant I'activite biologique et immunolocique 
de polypeptide natif correspondant. 



FEU1LLE DE REMPLACEMENT (REGLE 2§) 



BNSOOCID: <WO 99025*7*2 J _> 



WO 98/02547 



PCT/FR97/01295 



II s'agit avantageusement d'un polypeptide tel 
qu'exporte au-dela de la membrane cytoplasmique de 
Neisseria meningitidis, plus particulierement de la 
partie d'un tel polypeptide correspondant a la region 
5 conservee de 1 1 ADN . 

L' invention vise egalement des kits pour la mise en 
oeuvre des methodes definies ci-dessus. Ces kits sont 
caracterises en ce qu 1 ils comportent : 

- au moins un reactif tel que defini ci-dessus, a 
10 savoir de type acide nucl£ique, anticorps ou polypeptide, 

- les produits, notamment marqueurs ou tampons, 
permettant la realisation de la reaction d ' hybridation 
nucieotidique ou de la reaction immunologique visee, 
ainsi qu'une notice d* utilisation. 

15 La specif icite des produits de 1* invention et leur 

localisation sur le chromosome de Neisseria meningitidis 
Z2491 soit regroupes en region, pouvant etre interpretees 
. comme des ilots de pathogenecite, soit isoles sur le 
chromosome, leur conferent un interet tout particulier 

20 pour la realisation de compositions vaccinales a visee 
universelle, c'est-a-dire quelque soit la souche et la 
variability qu'elle exprime. Ces compositions peuvent 
inclure dans leur spectre d'autres prophylaxies, et etre, 
par exemple, associees aux vaccins de I'enfance. 

25 L 1 invention vise done des compositions vaccinales 

incluant dans leur spectre une prophylaxie a vis£e anti- 
meningococcique, destinees a prevenir toute infection 
susceptible d'etre provoquee par Neisseria meningitidis, 
ces compositions 6tant caract&risees en ce qu'elles 

30 comprennent, en association avec un ou des vehicule(s) 
physiologiquement acceptable( s) , une quantite efficace de 
polypeptides ou d'anti-anticorps ou de leurs fragments 
tels que definis ci-dessus, ces produits 6tant 
eventuellement conjugues, afin de renforcer leur 

3 5 immogenicite . 
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Des molecules immunogenes utilisables comprennent la 
proteine de polyovirus. la toxine tetanique, ou encore la 
proteine issue de la region hypervariable d'une piline. 

En variante, las compositions vaccinales selon 
5 1' invention sont caracterisees en ce qu'elles 
comprennent, en association avec un/des vehicule(s) 
physiologiquement acceptable( s ) , une quantite efficace : 

- d'acides nucleiques tels que definis ci-dessus, 

- de cellules hotes trans formees telles que definies 

10 plus haut, ou 

- de cellules de Nm dont le chromosome a ete delete 
d'au moins une sequence d'ADN selon 1' invention impliquee 
dans la pathogenicity de la bacterie. Le materiel 
nucleotidique utilise est avantageusement place sous le 

15 controle d'un promoteur favorisant son expression i n V I VO 
et la synthese de la proteine correspondante . II est 
egalement possible afin de renforcer 1 ' immunogenicite , 
d'associer ce materiel nucleique avec un ADN ou un ARN 
encodant une molecule porteuse telle que proteine de 

20 polyovirus, toxine tetanique, proteine issue de la region 
hypervariable d'une piline. 

Les compositions vaccinales de 1' invention sont 
administrables par voie parenterale, sous-cutanee, 
intramusculaire ou encore sous forme de spray. 

25 D'autres caracteristiques et avantages de 

1' invention sont donnes dans les exemples qui suivent 
afin d'illustrer celle-ci sans toutefois en limiter sa 
portee . 

Dans ces exemples, il sera fait reference aux 
30 figures 1 a 11 qui representent respect ivement 

- les figures 1A, IB, 1C, ID, IE, IF et 1G 1* analyse de 
la banque soustractive Tsp5091, 

- la figure 2, la distribution de sequences Nm- 
specifiques par rapport a Ng sur le chromosome de la 
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souche Z2491, (partie gauche) et de sequences Nm 
specif iques par rapport a Nl (partie droite), 

- la figure 3 A a 3C, la reactivite des clones des 3 
regions du chromosome, selon 1* invention, envers une 

5 panel de souches du genre Neisseria, 

- la figure 4, la position, dans la region 2 du 
chromosome de Nm, d* oligonucleotides utilises comrae 
sondes , 

- les figures 5, 6 et 7, les Southern blots d'un panel de 
10 souches du genre Neisseria, en utilisant des parties de 

la region 2 de Nm comme sondes, 

- les figures 8A a 8C, les Southern blots avec 3 banques 
soustractives sur un panel de 12 souches de Neisseria, et 

- les figures 9, 10 et 11, la reactivity de clones des 3 
15 banques soustractives vis-a-vis de Nm, Nl et Ng. 

Dans les exemples qui vont suivre, les mat6riels et 
m6thodes suivants ont ete utilises : 

Souches bacteriennes - Pour la realisation des banques 
soustractives, on a utilise la souche Z2491 de Nm 

20 (Achtman et ai., 1991, J. Infect. Dis. 164, 375-382) les 
souches MS11 (Swanson et al., 1974, infect. Iwmtm. 10, 
633-644), et les souches 8064 et 9764 de Nl, etant 
entendu que tout autre souche de l'espece consideree 
pourrait etre utilisee. 

25 Afin de verifier la specif icite de ces banques, 6 

souches de Nm, 4 souches de Ng, une souche de Nl 
(Neisseria lactamlca) et une souche de Nc (Neisseria 
clnerea) ont 6te utilisees. 

Les six souches de Nm sont : Nm Z2491 de serogroupe 

30 A, Nm 8013 de sferogroupe C (XN collection), Nm 1121 non 
sferogroupable (XN collection), Nm 1912 serogroupe A (XN 
collection), Nm7972 de serogroupe A (XN collection) et Nm 
8216 de serogroupe B (XN collection). 

Les quatre souches de Ng sont : Ng MS11 ( Institut 

35 Pasteur, Paris), Ng 403 (Institut Pasteur, Paris), Ng 
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6934 (Institut Pasteur, Paris), Ng WI ( isolee a partir 
d'une infection gonococcique disserainee ) , Ng 4C1, Ng 6493 
et Ng FA 1090. 

Les souches de Nl sont Nl 8064 et Nl 9764 (XN 
5 collection) et celle de Nc, Nc 32165 (XN collection). 

Techniques de genetigue moleculaire 

Sauf indication contraire, les techniques et 
reactifs utilises correspondent a ceux recommandes par 
Sambrook et al (Sambrook et al 1989, Molecular Cloning: 
10 A Laboratory Manual. Cold Spring Harbor Laboratory 
Press ) . Les oligodesoxynucleotides utilises dans cetre 
etude sont : 

RBaml2, 3 ' AGTGGCTCCTAG 54 (SEQ ID W54) 
15 RBam24, 5' AGCACTCTCCAGCCTCTCACCGAG 3'; (SEQ ID N # 55) 
Jbaml2, 3' GATCCGTTCATG 5'; (SEQ ID JT60) 
JBAM24 , 5' ACCGACGTCGACTATCCATGAACG 3'; (SEQ ID N*61) 
REcol2, AGTGGCTCTTAA; (SEQ ID W56) 

REco24, 5' AGCACTCTCCAGCCTCTCACCGAG 3'; <- RBam 24) 
20 JEcol2, GTACTTGCTTAA; (SEQ ID N # 62) 

JEco24, 5* ACCGACGTCGACTATCCATGAACG 3 ' ; (» JBam24 ) 

NEcol2, AATTCTCCCTCG; (SEQ ID N'64) 

NEco24, AGGCAACTGTGCTATCCGAGGGAG; (SEQ ID N # 65). 

25 Transferts stir membranes (Southern blots) 

Les transferts sur membranes ont ete realises par 
transferts capillaires sur des membranes en nylon 
chargees positivement (Boehringer Mannheim), Les 
hybridations ont ete realisees a 65 *C dans une solution 

30 comprenant NaPi 0,5M pH7,2/EDTA lmM/SDS 7%/ BSA 1%. Les 
lavages des membranes ont ete realisees dans une 
solution comprenant NaPi 40mM pH7,2/EDTA lmM/SDS 1%. Le 
lavage final a ete realise a 65 'C pendant 5 min. 

La sonde frp, obtenue avec des oligonucleotides 

35 bases sur la sequence de frpA correspond a 2,4 kb de 
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l'extremite 5' du gene de la souche Z2491. Les sondes 
opc et rotamase correspondant aux genes entiers sont 
produites a partir de la souche Z2491 en utilisant des 
oligonucleotides realises sur la base de sequences" 
5 publiees. Les sondes pxlCl et ppk (polyphosphate kinase) 
correspondent aux inserts des plasmides pJLl et 
pBluePPK600l , respect ivement . 

Exemple 1 : Realisation de banmies d'RDN pre sents chez 

10 Nm et absents chez Ngi 
a. Baugue "Mbol" 

Realisation - L ' ADN de Nm Z2491 a ete clive par 
1 1 endonuclease M2?oI et soumis a deux iterations d'une 

15 methode, appelee ci-apres CDA (Comprehensive Difference 
Analysis ) . Cette methode comprend une hybridation 
soustractive en presence d'un exces d'ADN cisaille de Ng 
MS11 et une amplification par PCR de celles des sequences 
meningococciques qui, etant absentes de ou ne presentant 

20 pas d'homologie significative avec 1 f ADN de Ng MS11, 
pouvaient se re-anneler. 

L ' ADN chromosomique de la souche Ng MS11 est 
cisaille de maniere aleatoire par passages repetes a 
tr avers une seringue hypodermique jusqu'a obtention de 

25 fragments dont la taille s'echelonne de 3 a 10 kb. Ces 
fragments d' ADN sont purifies par extraction phenolique. 

L' ADN chromosomique de la souche Nm 22491 est, quant 
a lui, clive par 1 1 endonuclease de restriction M2>ol. Ces 
fragments d'ADN (20 yg) sont ligatures a 10 nmoles des 

30 oligonucleotides anneles RBaml2 et RBam24. Les amorces en 
exces sont eliminees par electrophorese sur un gel 
d' agarose a 2% a bas point de fusion. La partie du gel 
contenant des fragments amplifies de taille sup6rieure a 
200 pb est excisee et digeree par la P-agarase. Ces 

35 fragments sont purifies par extraction ph6nolique. 
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Afin de realiser une hybridation soustractive 
(premiere iteration), 0,2 yg d'ADN Nm, ligature aux 
oligonucleotides RBam, est melange a 40 yg d'ADN Ng dans 
un volume total de 8 ml d'un tampon EE 3X (un tampon EE 
5 IX est compose de N-( 2-hydroxyethyl ) piperazine-N r -( acide 
sulphonique propane 3) 10 mM et d'EDTA 1 mM, son pH est 
de 8.0)- Cette solution est recouverte d'huile minerale 
et l'ADN est denature par chauffage a 100 *C pendant 2 
min. 2 yl de NaCl 5M sont ajoutes et on laisse le melange 
10 s'hybrider a 55 *C pendant 48h. Le melange reactionnel est 
dilue a 1/10 dans une solution prechauffee composee de 
NaCl et de tampon EE, puis imm6diatement place sur de la 
glace. 

10 yl de cette dilution sont ajoutes a 400 yl de 
15 melange reactionnel pour PCR (Tris.HCl pH9.0 lOmM; KC1 50 
mM; MgCl2 1,5 mM; Triton X100 0,1 %; 0,25 mM de chacun 
des quatre desoxynucleotides triphosphate ; Taq 
polymerase 50 unites par ml ) . Le melange est incube 
pendant 3 min a 70 *C pour completer les extremites des 
20 fragments re-anneles d'ADN meningococciques. 

Apres d^naturation & 94 - C pendant 5 min et addition 
de 1* oligonucleotide RBam24 a raison de 0,1 nmole par 100 
yl, les hydridations sont amplifi&es par PCR (30 cycles 
de 1 min a 94*C, 1 min a 70*C et 3 min a 72*C suivis par 
25 1 min a 94 # C et 10 min a 72 *C; Perkin-Elmer GeneAmp 
9600), 

Les fragments meningococciques amplifies sont 
separes sur gel des amorces et des ADN gonococciques de 
hauts poids molfeculaires. lis sont digeres par Mbol et de 
30 nouveaux oligonucleotides JBaml2 et JBam24 leur sont 
ligatures. Ces ADN ligatures sont a nouveau purifies sur 
gel et extraits au phenol* 

Une seconde iteration d 1 hybridation soustractive est 
realisee sur 40 yg d 1 ADN Ng cisail!6 de maniere aleatoire 
35 et 25 ng d'ADN ligature aux oligonucleotides JBam tel 
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qu ' obtenu a 1 1 issue de la premiere iteration 
d 1 hybridation soustractive. Lors de cette seconde 
iteration, 1 ' amplification de l'ADN Nm auto-annel£ est 
realisee a l'aide de 1 'oligonucleotide Jbam24. 
5 Sp6cificite - Afin de confirmer leur Nm- 

specificite, les sequences amplifliees apres la seconde 
iteration de la methode CDA sont marquees et utilisees 
comme sonde pour de l'ADN digere par Clal issu d'un panel 
de six souches de Neisseria meningitidis, quatre de 

10 Neisseria gonorrhoeae, une de Neisseria lactamica et une 
de Neisseria cinerea. 

Les Southern blots realises montrent que les 
sequences amplifliees a 1" issue de la seconde iteration 
de la m6thode CDA presentent une forte reactivite avec de 

15 nombreuses bahdes correspondant aux meningocoques et ne 
presentent pas de reactivity avec les bandes 
correspondant aux souches Ng, Nl, Nc. 

La banque "Mbol" apparait done comme Nm-sp6cifique. 
Exhaustivite - Afin de tester 1 ' exhaustivite de la 

20 banque, 1' ensemble des produits issus de la premiere et 
de la seconde iterations de la methode CDA ainsi que les 
materiaux chroraosomiques initiaux de Nm Z2481 et de Ng 
MSll sont soumis a electrophor£se sur gel d f agarose, 
trans feres sur membrane et mis en contact avec des sondes 

25 comprenant des genes connus pour etre meningococcus - 
specif iques, a savoir frp, opc, rotamase (Southern blot). 

II resulte de ces hybridations que le gene Nm- 
sp6cif ique frp est represents dans la banque Miol par un 
fragment de 600 pb, mais qu'aucune activity n'est 

30 observee pour les genes rotamase et opc. La banque Mbol, 
bien que Nm-specif ique, ne peut done etre consideree 
comme exhaustive. 

Etant donne leur haute specif icite, les fragments 
issus de la seconde iteration de la methode CDA pour la 
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banque Mbol peuvent neanmoins etre clones sur le site 
BamHI du plasmide pBluescript. 

Une sequence correspondant a un quelconque des genes 
Nm-specifiques ne peut etre incluse dans la banque 

5 soustractive que si elle est portee par un fragment de 
restriction de taille appropriee. Cette condition est 
fonction de deux facteurs. Premierement , la probability 
pour que les plus grands fragments soient entierement Nm- 
specifiques est faible. Deuxiemement, meme si de tels 

10 fragments existaient, ils seraient sous-representes dans 
la banque du fait des limitations de la technique PCR 
dont l'efficacite d 1 amplification diminue avec 
1 1 augmentation de la taille des fragments. Les fragments 
de taille superieure a environ 600 pb ne sont pas inclus 

15 dans la banque. Du fait de I'abscence, dans le chromosome 
de Nm 22491, de fragments Mbo de taille appropriee, les 
genes rotamase et opc ne peuvent etre inclus dans la 
banque. Une enzyme quelconque ne peut a elle seule 
produire un petit fragment correspondant a un gene Nm- 

20 specif ique quelconque. Une -deuxieme banque a done ete 
realisee en utilisant une autre enzyme de restriction 
avec une specif icite differente : Tsp509. 

b. Banque "Tsp509I" 
25 Realisation - L* enzyme Tsp5091 presente I'avantage 

de produire des fragments de plus petite taille 
(inferieure a 1 kb environ) que 1* enzyme Mbol. 

Tsp509I reconnait la sequence AATT et laisse, en 
saillie en 5', une sequence de 4 bases compatible avec 
30 EcoRI. Les oligonucleotides utilises sont Reco, Jeco et 
NEco. 

La methode suivie est conforme a celle suivie pour 
la realisation de la banque M MfioI M decrite ci-dessus. De 
plus fortes quantites d'ADN meningococciques ont 
35 cependant ete utilisees pour la premiere iteration 
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d 1 hybridation soustractive afin de compenser le plus 
grand nombre de fragments de faibles poids raoleculaires 
produits par Tsp509l. Pour la premiere iteration, 400 ng 
de fragments d'ADN Nm et, dans la seconde, 25 ng de 

5 fragments Nm sont soumis a hybridation soustractive avec 
40 pg d 1 ADN Ng cisaille de maniere aleatoire. 

Pour la realisation de cette banque "Tsp509I'\ a 
titre de controle, une troisieme iteration d 1 hybridation 
soustractive est realisee en utilisant 40 pg d'ADN Ng 

10 cisaille et 0,2 ng de fragments Nm resultant d'une 
digestion par rsp509l et d'une re-ligature aux 
adaptateurs NEco des fragments obtenus a 1* issue de la 
seconde iteration. 

Specificite - Comme decrit pour la banque 

15 pr6cedente, le produit issu de la deuxi&ne iteration de 
la ra£thode CD A est marquS et utilise comme sonde pour un 
panel de souches de Neisseria. 

La figure 1A illustre 1 1 hybridation Southern blot 
des produits de la seconde iteration de la methode CDA 

20 avec l'ADN digere par Clal de : Nm en piste a, de Ng MS11 
en piste b, de Nm 8013 en piste c, de Ng 403 en piste d, 
de Nm 1121 en piste e, de Ng 6934 en piste f, de Nm 1912 
en piste g, de Ng WI (souche DGI) en piste h, de Nm 7972 
en piste i, de Nl 8064 en piste j, de Nc 32165 en piste 

25 k, de Nm 8216 en piste 1. 

Contrairement a la forte reactivity observ^e avec 
toutes les souches Nm, une faible, ou aucune reactivite, 
est observee avec les souches Ng, Nl et Nc. 

La specifitfe de la banque a 6te etudiee plus avant 

30 en faisant r6ag±r des transferts sur membrane (Southern 
blots) des produits issus de chacune des trois iterations 
de la mfethode CDA avec des sondes correspondant a pilCl 
et ppk. Ces deux genes sont communs a Nm et Ng. 

La figure IB represente un gel d 1 agarose apres 

35 electrophorese des chromosomes de Nm Z2491 et Ng Msll, 
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digeres avec Tsp509 et des produits issus de chacune des 
iterations de la methode CDA. 

En piste a, a ete depose 1 pg du chromosome de Nm, 
en piste b 1 pg de celui de Ng, en piste c 0,15 pg des 
5 produits issus de la premiere iteration CDA, en piste d 
0,1 pg de ceux de la seconde iteration, en piste e 0,05 
pg de la troisieme iteration, mw representant les 
marqueurs de taille moleculaire. 

Les figures 1C et ID representent des gels realises 
10 comme decrits en figure IB apres transfert sur membrane 
( Southern blots ) et hybridation avec piiCl ( figure 1C ) et 
ppk ( figure ID ) . 

A 1 ' issue de la seconde interation de la methode 
CDA, les sequences correspondant aux genes pllCl et ppk 
15 sont completement exclues de la banque. 

Exhaustivite - L 1 exhaustivite de la banque a ete 
examinee en faisant reagir les produits issus de 
1 1 hybridation soustractive avec des sondes correspondant 
a trois genes Nm-specif iques (frp, rotamase et opc). 
20 Ces sondes Nm-specif iques reagissent avec les 

produits d' amplification issus de la premiere et de la 
seconde iteration d* hybridation soustractive. 

Les figures IE, IF et 1G representent des gels 
realises comme decrits en figure IB apres transfert sur 
25 membrane ( Southern blots ) et hybridation avec frpA 
(figure IE ) , rotamase (figure IF) et opc (figure 1G). 

Une troisieme iteration d 1 hybridation soustractive 
conduit cependant a la perte de sequences Nm-specif iques 
car les fragments reagissant avec les genes rotamase et 
30 opc sont absents de cette troisieme iteration. 

En consid6rant 1 T ensemble de ces donnees, il resulte 
que les produits issus de la seconde iteration de la 
methode CDA sont Nm-specif iques et constituent egalement 
une banque exhaustive des sequences Nm-specif iques. 
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Les produits issus de cette deuxieme iteration sont 
clones au niveau du site EcoRl du plasmide pBluescript. 

La banque produite par Tsp509l est plus exhautive 
que la banque produite par ttbol, comme les 
5 considerations theoriques basees sur la production 
enzymatique de plus petits fragments de restriction le 
supposaient. 

Selon cet aspect, il faut aussi noter que la banque 
Tsp509I est moins redondante que la banque Mbol c'est-a- 

10 dire qu'elle comprend moins de duplication de clones • 
86% des clones de la banque Tsp509l correspondent a des 
sequences distinctes alors que seulement 43% des clones 
correspondent a des sequences distinctes dans la banque 
Miol (donnees non presentees). 

15 La banque produite par Tsp509I const! tue done une 

source de clones Nm-specif iques. 

ExeffiPle 2 ; Analyse des clones des banmies soustractt^s 

20 Clonage et seguenqrage des AON Nxn- specif iques 

Les ADN des banques soustractives sont clones au 
niveau du site BamHI (banque Mibol ) ou EcoRI (banque 
Tsp509l) du plasmide pBluescript, puis transforms dans 
DH5a de E. coll. Les inserts sont amplifies par PCR 

25 realis^e sur les colonies transformees en utilisant les 
amorces M13-50 et M13-40, cette derniere amorce 6tant 
biotinylee & son extr&nite 5 • . 

Le sfequengage a 6t6 realise sur chaque produit PCR 
apres separation des brins biotinyl§s et non-biotinyles 

30 en utilisant le systeme Dynabeads M-280 a streptavidine 
(Dynal, Oslo). Les sequences sont criblees selon leurs 
homologies avec des sequences pr6cedemment publiees en 
utilisant les programmes informatiques Blastn et Blastx 
(NCBI, USA et Fasta). 
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Les produits PCR issus des colonies de bacteries 
transformees, apres utilisation des amorces M13-40 et 

M13-50 conune decrit ci-dessus, ont ete marques par 

32 

incorporation avec amorgage aleatoire de a - P-dCTP et 
5 ont ete utilises comme sonde pour les transferts sur 
membrane de l'ADN chromosomique digere par Clal des 
souches Nm Z2491 et Ng MS11, comme decrit ci-dessus afin 
de verifier leur specif icite. 

10 Cartographie des clones sur le chromosome de la 

souche Nm Z2491. 

On rapporte les resultats des etudes effectuees avec 
17 clones de la banque "Mbol" (designes par la lettre B) 
et 16 clones de la banque "rsp5091" (designes par la 

15 lettre E), chacun de ces clones presentant une sequence 
unique et sans contrepartie chez Ng. 

Les positions des sequences d'ADN correspondant aux 
produits Nm- specif iques clones ont ete determinees par 
rapport a la carte publiee du chromosome de Nm Z2491 

20 (Dempsey et al. 1995, J. Bacterid. ±22, 6390-6400) et a 
1 1 aide de transferts sur membranes ( Southern blots ) de 
gels d' agarose ayant ete soumis a electrophorese a champ 
pulse ( PFGE ) . 

Les clones Nm-specif iques sont utilises comme sondes 
25 pour une hybridation sur membranes (Southern blots) de 
1 * ADN de Nm Z2491 digere avec des enzymes a rares sites 
de coupure, a savoir Pad, Pmel, Sgfl. Bglll, Spel Nhel 
que Sgfl. 

Les gels (20 x 20 cm) etaient des gels a 1% 
30 d 1 agarose dans un tampon TBE 0,5X et ont ete soumis a 
electrophorese a 6 V/cm pendant 36 heures selon des 
periodes de pulsation variant de maniere lineaire entre 
5 et 35 secondes. 

Les hybridations sur membrane (Southern blots) ont 
35 ete realises comme decrit precedemment . 
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Les resultats obtenus sont rapportes sur la figure 
2 : la reactivite a ete localisee par comparaison avec 
les positions des fragments de taille correspondante sur 
la carte publiee. Les positions de 1' ensemble des 

5 marqueurs genetiques cartographies par Dempsey et al 
(precedemment cite) sont visualisees a l'aide de points 
sur la carte lineaire chromosomique. Les genes Nm- 
specif iques precedemment divulgues sont marques d'un 
asterisque. Les deux loci appeles "frp" correspondent aux 

10 genes frpA et frpC. Les locis "pilC" correspondent aux 
genes pllCl et p±2C2 qui sont des paires de genes 
homologues et qui ne sont pas distingues sur la carte. La 
precision des positions des clones Nm-specif iques de 
1 ' invention depend des chevauchements des fragments de 

15 restriction reactifs. En moyenne, la position est de +/- 
20 kb. 

Cette cartographie revele une distribution non 
aieatoire des sequences Nm-specif iques. La majorite des 
sequences Nm-specif iques appartiennent a trois groupes 
20 distincts. Un de ces groupes (region 1) correspond a la 
position de genes relatifs a la capsule precedemment 
decrits. 

On distingue : 

- E109, E138, B230 et B323 comme etant la region 1, 
25 - B322, B220, B108, B132, B233, B328, E139, E145 et 

B101 comme etant la region 2, et 

- B306, E114, E115, E124, E146, E120, E107, E137 et 
E142 comme etant la region 3* 

63% des sequences identifies comme spgcifiques des 
30 meningocoques sont localis6es & l f int6rieur de ces trois 
regions distinctes. 

Ce regroupement contraste avec la distribution de 
genes Nm-specif iques precedemment divulgues (frpA, frpC 
porh, opc et la region relative h la capsule). 
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Cet art anterieur suggerait en effet que les genes 
Nm-specifiques etaient a 1' exception des genes 
fonctionnellement relatifs a la capsule, disperses le 
long du chromosome. 

5 La cartographie des sequences Nm-specif iques sur le 

chromosome conduit a un resultat inattendu en regard de 
l'art anterieur. 

La majorite des differences genetiques entre les 
souches meningoccale et gonococcale testees sont 

10 regroupees en trois regions distinctes. 

La region 1 regroupe des genes relatifs a la capsule 
des meningococci. 

La fonction des genes des autres regions n'est pas 
connue mais des homologies avec des sequences publiees 

15 (tableau 1) suggerent des similarites entre certains 
genes de la region 3 et les proteines transposases et de 
regulation de bacteriophages. Aucun virus meningococcal 
n'a ete caracterise et il est tentant d'imaginer que ces 
sequences soient d'origine phagique. De maniere 

20 interessante, le genome de H. influenzae contient 
egalement une sequence homologue a celle de la proteine 
de regulation Ner du phage Mu mais on ne sait pas s'il 
s'agit d'un gene fonctionnel. 

Le clone B208 presente une forte homologie (48% 

25 d'identite, 91% d' homologie pour 33 acides amines) avec 
un clone des regions conservees (domaine III) dans la 
classe des proteines qui se lient aux siderophores 
ferriques TonB-dependants. 

La proximite de ce clone avec les genes Nm- 

30 specifiques porA et les genes regules par le fer frp, et 
en particulier la possibility qu'il s'agisse d ! une 
proteine recepteur Nm-specif ique exposee sur la membrane 
exteme font de lui un bon candidat pour de plus amples 
recherches. 
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Le clone B339 correspond a la sequence d' insertion 
Nm-specifique ISII06. 

La faible homologie entre le clone B134 et la 
sequence d ! insertion d'Aeromonas, ainsi que la presence 
5 en copies multiples du clone B134 parmi des souches 
variees de Nxn, suggerent qu'il pourrait representer un 
nouveau type de sequence d' insertion Nm-specifique, 

La possibility pour que les regions contenant les 
clones Nm-specif iques puissent correspondre a des ilots 
10 de pathogenicite comme precedemment deer it pour E. coli 
et y. pestls est d'un interet particulier. 

Les clones isoles dans cette invention vont 
permettre de mieux comprendre la pertinence des regions 
Nm-specifiques en permettant le clonage et le sequengage 
15 de fragments chromosomiques plus grands et directement 
par leur utilisation pour des mutations de loci. 

Enfin, la detection des genes meningococcus - 
specif iques, eventuellement impliqu6s dans la 
pathogenicite de l'organisme, permet de cibler des 
20 antigenes appropri6s utilisables dans un vaccin anti- 
meningococcique • 

L'efficacite et la rapidite de la methode selon 
1* invention permettent son utilisation dans un grand 
nombre de situations pour lesquelles les differences 
25 genetiques responsables d'un phfenotype particulier & un 
de 2 pathogenes proches sont recherchees. 

Etude de la rfcactivite des clones des regions 1, 2 et 3 
vis-a-vis d'un panel de souches de Neisseria 

30 Les produits PCR correspondant aux inserts de chacun 

des clones ont ete rassembles et utilises comme sondes 
d 1 hybridation sur membranes (Southern blots) pour un 
panel de souches de Nm, de Ng, de Nl et de Nc. 

Les regions 1 et 2 produisent un nombre limite de 

35 bandes pour chacun des meningocoques . Cela sugg&re que 
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ces regions sont a la fois Nm-specif iques et communes a 
tous les meningocoques . 

La figure 3 illustre la reactivite des clones des 
regions 1, 2 et 3 envers un panel de souches 

5 neisseriales. Les clones des regions 1 (figure 3A), 2 
(figure 3B) et 3 (figure 3C) pris ensemble ont ete 
utilises comme sondes envers un panel de meningococci, 
gonococci et envers une souche de Nl et de Nc. 

Les pistes sont les suivantes : ADN de Nm Z2491 en 

10 piste a, de Ng MS11 en piste b, de Nm 8013, en piste c, 
de Ng 403 en piste d, de Nm 1121 en piste e, de Ng 6934 
en piste f, de Nm 1912 en piste g, de Ng WI (souche DGI ) 
en piste h, de Nm 7972 en piste i, de Nl 8064 en piste j , 
de Nc 32165 en piste k, de Nm 8216 en piste 1. 

15 De maniere remarquable, la region 3 ne presente de 

reactivite qu'avec les meningococci de serogroupe A. 
Cette region 3 est done specif ique d'un sous-groupe de 
Nm. 

Une comparaison avec des sequences connues dans les 
20 banques de donnees a ete realisee afin d'evaluer les 
possibles fonctions des regions donees. 

Le tableau 1 qui suit donne les positions des clones 
specifiques sur la carte chromosomique et les homologies 
avec des sequences connues. 
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On peut voir, tout d'abord, que les clones de la 
region 1 correspondent tous aux g6nes impliques dans la 
biosyn these de la capsule . Ces genes ont ete prec6demment 
etudies parmi les Nm de serogroupe B (Frosch et al. 1989, 
5 Proc. Natl. Acad. Sci. USA fl&, 1669-1673 et Frosch et 
Muller 1993, Mol. Microbiol, a 483-493 ). 

A 1' exception d'une faible homologie avec 
l'activateur de hemolysine de Serratia marcescens, les 
clones de la region 2 ne presentent aucune homologie 
10 significative avec les sequences publiees, que ce soit au 
niveau de I'ADN ou des proteines. 

Deux des clones de la region 3 presentent 
d ' interessantes homologies avec des proteines qui se 
lient a l'ADN, en particulier les proteines de regulation 
15 et les proteines transposases de bacteriophages. 

Le clone B208 prfesente une forte homologie avec une 
des regions conservees dans une classe de rfecepteurs 
( siderophore f errique TonB-dependant ) . 

Les clones B134 et B339 s'hybrident avec de 
20 nombreuses regions du chromosome (au moins 5 et au moins 
8 , respectivement ) . 

Les donn&es concemant les sequences montrent que le 
clone B339 correspond a la sequence d 1 insertion Nm- 
specifique SI106. 
25 La traduction du clone B143 presente une homologie 

limitee avec la transposase d'une sequence d* insertion 
Aeromonas ( SAS2 ) ( Gustaf son et al. 1994, J. Mol. Biol. 
222/ 452-463). Nous avons pu d&nontrer par transfert sur 
membrane (Southern blots) que ce clone est une entite Nm- 
30 specifique pr6sente en multiples copies dans les 
chromosomes de chaque meningocoque du panel teste. 

Les autres clones ne presentent pas d 1 homologie 
significative avec les sequences neisseriales publiees ni 
d'ailleurs avec aucune sequence publiee. Ces clones 
35 constituent done, avec la majorite des autres clones 
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isoles, une banque de loci Nm-specif iques 
nouveaux . 



totalement 



F .xpmni e 3 : saris d e la region 2 dy cbTOmosom s-fla-Mm 

. Determination et caracterisation de la sequence de 
la region 2 

On precede a une amplification par PCR avec de l'ADN 
chromosomique de la souche Z2491 de serogroupe A, sous- 
groupe IV- 1, en utilisant des amorces d' oligonucleotides 
elaborees a partir de chacune des sequences de clones de 
la region 2, selon de nombreuses combinaisons 
differentes. On sequence les produits de la PCR qui se 
chevauchent a partir des 2 brins en utilisant la 
technique de terminaison de chaine et le sequencage 
automatise (ABZ 373 ou 377). 

Pour prolonger la sequence au-dela des limites des 
clones disponibles, on clone des fragments partiels 
SauIIIA de 15 kb, de la souche Z2491, dans Lambda DASH- 

II (Stratagene) . 

On identifie les phages contenant les inserts 
chevauchant la region 2 par hybridation avec comme sondes 
des clones de cette region. L'ADN insere est sequence a 
partir des extremites des inserts et ces sequences sont 
utilisees pour elaborer de nouvelles amorces qui 
serviront a amplifier directement l'ADN chromosomique et 

non l'ADN phagique. 

On obtient une amplification de l'ADN chromosomique 
en utilisant ces nouvelles amorces et celles de la 
sequence precedemment disponible. 

Ces produits PCR sont egalement sequences a partir 
des 2 brins , ce qui conduit a une sequence complete de 
15620 pb (SEQ ID N'36). On analyse les cadres de lecture 
de cette sequence qui commencent par ATG ou GTG et qui 
sont caracterises par un indice d' usage de codons eleves. 
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Cette analyse revele 7 COLs de ce type qui remplissent la plus grande partie de la 
sequence de 15620pb. Les positions de ces COLs sont les suivantes: 
COL-1: 1330 a 2970 (SEQ ID N°37); COL-2: 3083 a 9025 (SEQ ID N°38); COL-3: 
9044 a 9472 (SEQ ID N°39); COL-4: 10127 a 121 18 (SEQ ID N°40); COL-5: 121 18 a 
5 12603 (SEQ ID N°41); COI^6: 12794 a 13063 (SEQ ID N°43); COL-7: 13297 a 14235 
(SEQ ID N°44); et COL-8: 14241 a 15173 (SEQ ID N°45). 

Le COL-4 commence avec le codon GTG et cbevauche un COL legerement phis 
petit (SEQ ED N°41) dans le meme cadre de lecture (9620-12118, cadre 2) et qui 
commence par le codon ATG. 
10 COL-4 code pour une proteine qui presente des homologies structurelles avec 

une famille de polypeptides comprenant les pyocines (Pseudomonas aeruginosa), 
collcines et intxmmes (Escherichia coli) qui sont des toxines bactericides (pyocines, 
coDcines) ou des proteines de surfaces impliquees dans Fadhesion des bacteries aux 
proteines eucaryotes. Le COI^7 encode une proteine dom la sequence contient une 
15 region potentieliement transmembranaire, et qui presente des homologies structurelles 
avec des proteines peripiasmiques ou inserees dans la membrane externe des bacteries. 
Les homologies structurelles de COL-4 et COL-7 ont ete identifiees a l'aide du 
programme Prop Search. 

La recherche de sequences homologues aux autres COL dans GenBank a l'aide 
20 du programme BLAST a revele une homologie entre les regions N-terminales de COI^2 
et rhemagglutinine filamenteuse B de Bordetella pertussis (43% de smrilarite, 36% 
d'identite sur 352 acides amines) et entre COH et la proteine fliaCde Bordetella 
pertussis (35% de similarity 27% d'identite sur 401 acides amines). COH et COL-2 
sont des genes voisins dans la souche Z2491 et rhemagghmnme filamenteuse B de 
25 Bordetella pertussis et fluC sont des genes voisins dans Bordetella pertussis, ce qui 
renforce la probabilite que ces homologies refletent des homologies fonctionnelles 
. Confirmation de la specifiche de la region 2 vis-a-vis de Nm 
On effectue des Southern blots en utflisant des sondes d'ADN obtenues par 
amplification par PCR de differentes parties de la region 2 en utilisant des amorces 
30 ohgonucleotidiques elaborees a partir de sequences de clones de la region 2. 

On a represente sur la figure 4 la position approximative de ces oligonucleotides. 
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II s'agit, dans une moitie de C0L-1, des 
oligonucleotides appeles R2001 (SEQ ID N # 46) et R2002 
(SEQ ID N # 47), dans une moitie de COL-l+la majeure partie 
de COL-2, des oligonucleotides b332a (SEQ ID N*48), el39a 
5 (SEQ ID N*49), bl32a (SEQ ID N*50) et b233b (SEQ ID 
N # 51), et dans 1/3 de C0L-4+ COL- 5 a 7, des 
oligonucleotides el45a (SEQ ID W52) et blOla (SEQID 
N # 53). 

Les trois Southerns sont realises dans les 
10 conditions d ' hybridation suivantes: 
16 h a 65'C, 
NaP0 4 0,5M, pH 7,2 
EDTA-Na 0,001M 

1% de dodecylsulf ate de sodium. 

15 

Pour le lavage, on chauffe 10 rain a 65 *C et on 
utilise NaPO< 0,5m, pH 7,2; EDTA-Na 0,001M, 1% de 
dodecylsulf ate de sodium. 

Les figures 5, 6 et 7 representent respectivement 
20 les Southern blots obtenus avec chacune des parties de 
COL mentionnees plus haut. 

Les 14 pistes correspondent respectivement, dans 
chacun des Southerns, a 
1: MS11 (Ng) 
25 2: 403 (Ng) 

3: FA1090 (Ng) 
4: Wl (Ng) 
5: 6493 (Ng) 

6: marqueur (lambda hindlll) 
30 7: Z2491 (Nm, gpA) 

8: 7972 (Nm gpA) 

9: 8013 (Nm, gpC) 

10: 1121 ( Nm non groupable) 

11: 1912 (Nm, gpB) 
35 13: 32165 (Nc) 
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14: 8064 (Nl). 

Etarrt donne qu' un panel de souches de Neisseria est 
utilise dans ces experiences et que chaque puits est 
5 charge avec une quantite similaire d'ADN digere, ces 3 
Southerns blots montrent clairement que les sequences 
correspondant a la region 2 sont trouvees dans tous les 
meningoccoques testes et qu'il n'existe pas dans le 
genome de Ng des souches testees de sequences homologues 
10 signif icatives . 

EttCTPle 4 ; Identification de regions du genome de Nm 
absentes de Nl et communes avec Nq 

15 On opere selon la technique decrite dans I'exemple 

1, mais on utilise 1 1 ADN chromosomique d'une souche de Nm 
(Z2491) et de 2 souches de Nl (collection XN) dont on 
melange les ADN a parts egales. 

On efffectue 2 soustractions en utilisant les series 

20 d 1 amorces R et J. Trois banques differentes sont ainsi 
realisees. 

Deux banques , appelees Bam et Eco, sont 
respectivement obtenues par digestion de I'ADN 
chromosomique de Nm Z2491 par Mbol et Tsp5091; une 
25 troisieme banque, appelee Cla, qui resulte de la 
digestion de I'ADN chromosomique de Nm par Mspl, est 
obtenue en utilisant le jeu d* amorces RMsplO, RMsp24, 
JMsplO et JMsp24. L 1 ensemble des amorces utilisees est 
donn6 dans le tableau 2 suivant. 
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Tableau 2 



5 Adaptateurs pour banques dif f 6rentielles 



ADN chromosomique digere par Clonage dans 
10 pBluescript par 

Miol -> BamHI 

Tsp509l -» EcoRI 

Mspl -> Clal 

15 



20 



Premier tour de soustrraction 

RBaml2 : 3' AGTGGCTCCTAG 
RBam24 :5' AGCACTCTCCAGCCTCTCACCGAG 



5 ? (SEQ ID N # 54) 
3' (SEQ ID N*55) 



REC012 : AGTGGCTCTTAA (SEQ ID N*56) 

25 RBam24 : 5 1 AGCACTCTCCAGCCTCTCACCGAG 3' (SEQ ID N # 55) 

(REco 24 = RBam 24) 



RMsplO 



30 



AGTGGCTGGC (SEQ ID N"57) 



RMsp24 : 5'AGCACTCTCCAGCCTCTCACCGAC 



3' (SEQ ID N'58) 



Deuxi6me tour de soustraction 

35 Jbaml2 : 3* GTACTTGCCTAG 5 1 (SEQ ID W59) 

JBam24 : 5' ACCGACGTCGACTATCCATGAACG 3 f (SEQ ID N*60) 



40 



45 



JEcol2 : GTACTTGCTTAA (SEQ ID N'61) 

JBam24 : 5 • ACCGACGTCGACTATCCATGAACG 3' (SEQ ID N'60) 

(JEco 24 » JBam 24) 

JMsplO : GTACTTGGGC (SEQ ID N # 62) 

JMsp24 : 5 f ACCGACGTCGACTATCCATGAACC 3 ■ ( SEQ ID N*63) 
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Apres 2 soustracticms, on marque la totalite du 
produit de chaque amplification et on 1' utilise comme 
sonde . 

5 On effectue un controle des banques soustractives 

par Southern blot sur un panel de 12 souches de Neisseria 
( ADN chrotnosomique coupe par Clal). Les conditions 
d ' hybridation sont identiques a celles donnees dans 
1 ' exemple 1 . 

10 Ces Southern blots sont donnes sur les figures 8 A a 

8C, qui sont respectivement relatives a la banque 
MboI/BamHI , a la banque Mspl/Clal et a la banque 
Tsp5091/EcoRI. 

Les 12 pistes correspondent respectivement a : 
15 1: Nm Z2491 (groupe A) 
2: Nl 8064 

3: Nm 8216 (groupe B) 
4: Nl 9764 

5: Nm 8013 (groupe C) 
20 6: Ng MS11 

7: Nm 1912 (groupe A) 
8: Ng 4C1 

9: Nm 1121 (non groupable) 
10: Ng FA1090 
25 11: Nc 32165 

12: Nm 7972 (groupe A). 

L'examen des Southern blots montre que les sequences 
contenues dans chaque banque sont specif iques de Nm et ne 
30 sont pas trouvfees chez Nl. De plus, la reactivite 
observee avec les souches de Ng suggere que certaines de 
ces sequences sont presentes chez Ng. 

Chacune de ces banques a ensuite ete clonee dans 
pBluescript au site BamHI pour Bam, ou EcoRI pour Eco, ou 
35 Clal pour Cla. Afin de confirmer la specificity des 
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clones vis-a-vis du genome de Nm, on a procede a une 
restriction des clones individuels et a leur 
radiomarquage. Les clones montrant a la fois une 
reactivite pour Nm et Ng ont ete conserves pour des 

5 etudes ulterieures. Ces clones sont representes sur les 
figures 9, 10 et 11, qui donnent les profils, vis-a-vis 
de Nm, Nl et Ng, de 5 clones de la banque Bam (figure 9), 
de 16 clones de la banque Eco (figure 10), et de 13 
clones de la banque Cla (figure 11). 

10 Ces clones ont ete sequences en utilisant des 

amorces universelles et inverses. II s'agit 
des clones Bam 

Bll partiel de 140 pb ( SEQ ID N*66), B13 partiel estime a 
425 pb (SEQ ID N" 67), B26 de 181 pb (SEQ ID N' 68), B33 

15 de 307 pb (SEQ ID N # 69), B40 de 243 pb (SEQ ID W 70), 
- des clones Cla 

CI 6 de 280 pb (SEQ ID N # 72), C20 partiel estim£ a 365 
pb (SEQ ID N* 73), C24 partiel estime a 645 pb 
(SEQ ID N* 74), C29 partiel estime a 245 pb (SEQ ID 

20 N* 75), C34 de 381pb (SEQ ID N # 76), C40 de 269 pb (SEQ ID 
N- 77),C42 de 203 pb (SEQ ID.N # 7B),p C43 de 229 pb (SEQ 
ID N- 79), C45 de 206 pb (SEQ ID N # 80),C47 de 224 pb 
(SEQ ID N # 81), C62 de 212 pb (SEQ ID N # 82), et C130 
(5'..-) estime a 900 pb (SEQ ID N' 83), et 

25 - des clones Eco 

E2 de 308 pb (SEQ ID N* 84), E5 partiel, estime a 170 pb 
(SEQ ID N # 85), E22 partiel estime a 300 pb ^(SEQ ID 
N # 86), E23 de 273 pb (SEQ ID N # 87), E24 de 271 pb (SEQ 
ID N* 88), E29 de 268 pb (SEQ ID N # 89), E33 partiel, 

30 estimS a 275 pb (SEQ ID N # 90), E34 partiel, estime a 365 
pb (SEQ ID N* 91), E45 de 260 pb (SEQ ID N* 92), E59 
estimation superieure a 380 pb (SEQ ID N* 93), E78 de 308 
pb (SEQ ID N # 94), E85 de 286 pb (SEQ ID N* 95), E87 de 
238 pb (SEQ ID N* 96), E94 partiel, superieur a 320 pb 
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(SEQ ID N* 97), E103 partiel, superieur a 320 pb ( SEQ ID 
N' 98) et E110 de 217 pb (SEQ ID N # 99). 

La cartographie de chaque clone a ete effectuee sur 
le chromosome de Nm Z2491 en operant comme deer it dans 
5 l'exemple 2. Les resultats obtenus sont donnes sur la 
partie drolte de la figure 2. On constate que ces clones 
correspondent aux regions appelees 4 et 5 . Ces rfegions 
sont done constitutes de sequences presentes a la fois 
chez Nm et chez Ng, mais non trouvees chez Ml. II est 

10 done considere qu'il s'agit de sequences codant pour des 
facteurs de virulence responsables de la colonisation 
initiale et de la penetration de la muqueuse. La region 4 
est localisee entre argF et regF sur le chromosome de Nm 
2491 et la region 5 entre le marqueur lambda 375 et penA. 

15 Cette region contient vraisserablablement des sequences 
codant pour un variant Opa et une proteine liant la 
transferrine. 

Une comparaison avec les sequences connues dans les 
banques de donnees a moitife que dans la region 4 seul le 

20 clone C130 presente une homologie, & savoir avec Mspl 
methylase. Dans la region 5, aucune homologie avec des 
sequences connues n'a ete trouvee avec les clones C8, E2, 
B40, C45, E23 et E103. Pour les autres clones, les 
homologies sont les suivantes : 

25 Bll arginine decarboxylase SpeA; C29 arginine 

decarboxylase SpeA; C62 oxoglutarate/malate 

transporteur; repetitive DNA element; E34 element 
repetitif d'ADN ; E94 endopeptidase MepA murine ; C47 
citrate synthase PrpC; E78 citrate synthase PrpC 

30 

Exemole 5 ; Mise en Evidence de la presence d'une nti 

BiliaifiUga — aQUCheS de Neisseria meningitidis dana m 

6chairfcillon bioloyique. 

Un echantillon biologique de type liquide c6phalo- 
35 rachidien, urine, sang, salive est pr61eve. 
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Apres filtration et extraction, les ADN presents 
dans cet echantillon sont soumis a electrophorese sur gel 
et transferes sur raerobrane par Southern blotting - 

Une sonde nuclectidique constituee par le marquage 
au 32 P de la SEQ ID n*5 est incubee avec cette membrane 
de transfert. 

Apres antoradiographie, la presence de bande(s) 
reactive(s) permet de diagnostiquer la presence de 
Neisseria meningitidis dans 1 'echantillon . 

Exeaple 6 : Com petition vacpinale incluant — daH5 SOU 

spectre une prophylaxie a visee an ti -meningococci que et 
rigstinee a nrevenir toute f orme d 1 infection par Neisseria 

meningitidis , 

Le peptide code par une sequence incluant la SEQ ID 
n*l0 est conjugue a une toxine. 

Ce peptide conjugue est alors ajoute a une 
composition comportant le vaccin anti -Haemophilus et 
anti-pneumocoque, ou tout autre vaccin de I'enfance. 

La composition resultante peut, apres avoir et6 
rendue sterile, etre injectfee par voie parenterale, sous- 
cutanee ou intramusculaire. 

Cette meme composition peut egalement etre 
pulverisee au niveau des muqueuses a I'aide d'un spray. 



FEUILLE DE REMPLACEMENT (REGLE 2§) 



WO 98/02547 



46 

LISTE DE SEQUENCES 



PCT/FR97/01295 



(1) INFORMATIONS GENERALES: 

I : ) ITEPOSAOT 

(A) NCM: I.N.S.E.ft.M 

(B) RUE: 101. rue de Toibiac 

(C) VILLE : PARIS CEDEX 13 
(E) PAYS: FRANCE 

(?) CODE POSTAL: 75654 

(ii) TITRE DE L' INVENTION: ADN. proteines et peptides speci::cues des 
bacteries de i'espece Neisseria meningitidis, leurs procedes c'cbtencion et 
leurs applications biologiques. 

fill) NCMBRE DE SEQUENCES: 99 

(iv) FCRME DECHIrrRABLS PAR ORDINATEUR: 
(A) TYPE DE SUPPORT: Floppy disk 
(3) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D* EXPLOITATION : PC-DOS/MS-DOS 

(D) LCGICIZL: Patentln Release *1.0. Version n.30 (CE3) 

(2) INFORMATIONS POUR LA SEQ ID NO: 1: 

( l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 257 paires de bases 
(3) TYPE : nucleotide 

(C) NCMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: 22491 



(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 
GATCC3CTGC GSGCAGACGA ATATCAAGAC ATCTTCGATT TTATGAAACA GTATGACTTG 60 
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TCTTACCCGT ATGAATATCT GCAGGATTGG AT AG ATT ACT ATACGTTCAA AACCGATAAG 120 

CTCGTATTTG GTAACGCGAA GCGAGAGTGA GCCGTAAAAC TCTGAGCTCC TGTTTTATAG ISO 

ATTACAACTT TAGGCCGTCT TAAAGCTGAA ACATTTTCGA A AG CT ATA A A TTGAAGCCCT 2 AO 

TCCACAGTAC ATAGATC -5? 



(2) INFORMATIONS POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE. 

(A) LONGUEUR: 276 pa ires de bases 
(3) TYPE: nucleotide 

(C) NOMERE CE ERINS : simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE TE MOLECJLE: ADN (genomique) 

( v; ; CRIGINE. 

(A) ORGANISMS: Neisseria meningitidis 

(3) SOUCHE: Z2491 
txi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2. 
GATCATGTTC AAATAGATAG GCATGGGAAG CTGCAGCTCT AACGTCCATG AAAATATGTT 6 0 

GCATAGCTGC AAGCGGAACG CCTTTTCTTT CATCTACATA ATCTATAGAG TCAAGGCAAC 120 
CGCTATTGAA ATTAGCAGTA TTGCCTATGA TTACATTAGT AATATGCTCA TACCATTTTT 180 
GGGTGGTCAT CATATTGTGC CCCATTGTrA TCTCCTTATA TTGGTTTTAG AAGGAACTTT 240 
GACAGGAAGA ATAACGGCCT TACCTGTTTG ACGATC 276 
(2) INFORMATIONS POUR LA SEQ ID NO: 3: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 4 28 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRJE DE BR INS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE. ADN (genomique) 
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(vi) CRIGINE: 

(A; CRGANISME: Neisseria meningitidis 
(3) SOUCHE: Z24?\ 

I xi) CESCRIPTICN DE LA SEQUENCE: SEQ ID NO: 3; 

GATCTGGTGG TGTTTGCACA GGTAGGCGCA TACTTGTT CG GGACTGAGTT TGCGGCGGAT 60 

AAGGGTGTCG A7GTGCTGAA TCAGCTGGGA ATCGAGCTTA TAGGGTTGTC GC7TACCC7G 120 

TTTGATAGTC CGGCTTTGCC GCTGGGCTTT TTCGGCGCTG 7ATTGCTGCC CTTGGGTGCG 180 

GTGCCGTCTG ATTTCGCGGC TGATGGTGCT TTTGTGGCGG TTAAGC7GTT TGGCGATTTC 24 0 

GGTGACGGTG CAGTGGCGGG ACAGGTATTG GATGTGGTAT CGTTCGCCTT GGGTCAGT7G 300 

CG7G7AGC7C A7GGCAATC7 TTC7TGCAGG AAAGGCCGTA TGCTACCGCA TACTCGCC77 3 60 

TTTCTGTTAG GGAAAGTTGC ACTTCAAATG CGAATCCGCC GACCTCTTTC AGTTACAGCA 4 20 

GCTTGATC 428 

(2) INFORMATIONS POUR LA SEQ ID NO: 4: 

( i ) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 390 paires de bases 
(3) TYPE : nucleotide 

(C) NOMBRE DE SRINS: simple 

(D) CONFIGURATION: iineaire 

(ii) TV?5 DE MOLECULE; ADN (genomique) 

(vi) ORIGINS : 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 

GATCCTGCAT TGACATCGGC CTTCGCTGTC AGGGTATTCT GACOGGTAAA GTOGGCATTA 60 

CCGTTGGCCA ATAAGGATAC ATGACCGTCT GCAGAAACAG CATGAAGGCC GTCTGAAACG 120 

ATATTGCCrr GCAATGCGGT GGTTTCGAGA GCCTTGGCTG CGTTCAGCTT GGTATTGCGA 180 

AGCTGAATAT TGCCTTTGGC TGCCTGAATG TGCAGATTAC CCGAGTTGGT ACGCAGATTG 240 
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GTATTGGTAA CATTCAGCAA GCCTGCC7CC ACACCCATGT CTTTTGAGGC AGTGAGGGT7 300 
TTACTGGTGC CGGTAATATG GGCAGCGTTA TCCGATTTCA AATGGATGC7 GGCCGCC\GA 3 60 
CAAATCT77A TCAACATTCA AATTCAGATC 3 90 

(2) INFORMATIONS POUR LA SEQ ID NO: 5: 

U) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 177 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineaire 

In) TYPE DE MOLECULE: ADN (genomique) 

(v:) CRIGINE. 

(A) ORGANISME: Neisseria meningitidis 
(3) SOUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 

GATCAGATTG GTGAAGACGG TATTACCGTC AATGTTGCAG GCCGTTOGGG ATATACGGCG 60 

AAAATCGACG TGTCTCCGAG TACCGATTTG GCGGTTTATG GCCATATTGA AGTTGTACGG 120 

GGTGCAACGG GGTTGACCCA ATCCAATTCA GAGCCGGGTG GAACCGTCAA TTTGATC 177 

(2) INFORMATIONS POUR LA SEQ ID NO: 6: 

(I) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 341 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUQE: 22491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 
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GATCAATGAT GCTACTATTC AAGCGGGCAG 77 CCGTG7AC AGCTCCACCA AAGGCGATAC 60 

TGAATTGGGT GAAAATACCC GTATTATTGC TGAAAACGTA ACCGTATTAT CTAACGGTAG I2C 

TATTGGCAGT GCTGCTGTAA T7GAGGCTAA AGACACTGCA CACATTGAAT CGGGCAAACC 130 

GCTTTCTTTA GAAACC7CGA CCGTTGCCTC CAACATCC37 TTGAACAACG GTAACATTAA 240 

AGGCGGAAAG CAGCTTGC77 TACTGGCAGA C3ATAACATT ACTGCCAAAA CTACCAATCT 300 

GAATACTCCC GGCAATCTGT ATGTTCATAC AGGTAAAGAT C 341 

(2) INFORMATIONS POUR LA SEQ ID NO: 7: 

(i) CARACTERI ST I QUE S DE LA SEQUENCE: 

(A) LONGUEUR: 164 paires de bases 

(3) TYPE: nucleotide 

(C) NCMBRE EE BRINS: simple 

O) CONFIGURATION: lineaire 

(::) TYPE DE MOLECULE: ADN (genomique) 

(vi) CRIGINE: 

(A) ORGANISME: Neisseria meningitidis 
(3) SCUOTE: 22491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7: 

GATCCAACTG TTTGATTTTA CTGGCTGCTT CTCCATGCGC GGTATTGACC AAAGCCGCAA 60 

GGATATTCGC 77 CCAGAT7G TCTTTCAGGC TGCCGCCGTT GACAGCGGTA TTAATCAGTG 20 

CGGCACTGCC C3CATTGGCT AGGTTGACGG TCAGGTTCTT GATC 164 

(2) INFORMATIONS POUR LA SEQ ID NO: 8: 

( i ) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 219 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN | genomique) 
(vi) ORIGINE: 
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(A) ORGANISME: Neisseria meningitis 

(B) SOUCHE: Z2491 

IXiJ DESCRIPTION DE LA SEQUENCE. SEQ ID NO: 8: 

GA7CAATCAC ACA 7CT7GT C ATTTTTTCGA TTCCTTCATT TCGGTTTC7A ATGTTTCAAT 6 0 

TCTTGCGGCC A7TTCCTGAA TGGCT7TAGT CAAAACGGGG ATGAACGCT7 CG7A77CGAC 120 

GGTGTAGGTA TCGTTTGTTT TATTTACCAT CGGCAATCGA CCATATTCAT CTTCCAGCGC 180 

AGCAATGTCC T3GGCAATAA ACCAATGCCG CAACCGATC 219 

(2) INFORMATIONS POUR LA SEQ ID NO: 9: 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 356 paires de bases 
13) TYPE: nucleotide 

(C) NOKBRE DE BRINS : simple 
ID) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

[B] SOUCHE: 22491 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 9: 

GATCTTGGGT AAGCCCCCAA CCTGCATAGA AAGGCAGGCC GTAGCAGCTG ACTTTTTTGC 60 

CGCGCAACAA GGCTTCAAAA CCGGTCAGCG AAGTCATGGT ATGTATTTCG TCTGCGTATT 120 

GGAGACAGGT CAGGATGTOG GCTTCTTOGG CGGTTTCGTC GGCATATCGT GCAGCATCAT 180 

CAGGGGAAAT ATGGCCGATG CGGTTACCGC TGACTACATC GGGATGCGGT TTGTAGATGA 2 40 

TATAGGCATT GGGGTTTOGT TCGCGTACGG TACGGAGCAA ATCCAGATTG OGGTAGATTT 300 

GGGGCGAACC GTAGCGGATA GAOGCATCAT CTTCAACCTG GCCGGGAAOG AGGATC 356 



(2) INFORMATICS POUR LA SEQ ID NO: 10: 

( i ) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 210 paires de bases 
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(3) TYPE . nucleotide 

(C) NOMBRE DE BR INS : simple 

(D) CONFIGURATION : Uneaire 

tii) TYPE DE MOLECULE: ADN (cenomiquel 

<vxj GRIG IKE - 

(A) CRGANISME. Neisseria meningitidis 
IS) SCUCHE: 22-191 

(:<:) DESCRIPTION DE LA SEQUENCE : ScQ ID NO. 10: 

GATCCGCTTT CAGTTTCCGT ACCGGTGGCA TCAGTCAAG7 CCGTTTTGTG CACCAAACC3 60 

C3TCCATATG AAACATAAAA CAAATCGCTT AAGCCCAAAG GGTTATCGAA CGATAAAGCG 120 

ACATTTCCTT GATATTTGCC GGTCGTTTTG CC3CCCGCAT CATCTATACC GA7ACTGAAC 180 

C3TATGGGT7 TA7TCTGCTG CCATTTGATC 210 

(2) INFORMATIONS POUR LA SEC ID NO: U; 

(l) CARACTERISTIQUES DE LA SEQUENCE; 

(A) LONGUEUR: 25 9 pa ires de bases 

(B) TYPE: nucleotide 

(C) NCMBRE DE BRINS: simple 

(D) CONFIGURATION: iineaire 

Ui) TYPE DE MOLECULE: ADN (genoraicue) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 
(3) SCUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 11: 
GATCCCGAAA CGCAATTGGT OGAAAGCTAT ATGCTGAACG A7GTGTTGCG GTTTTGG GAC 60 

AGOGCAGGTT TGGGOGATGG GAAAGAAGCC GACCGCGCCC ATCGGCAAAA ACTGATTGAT 120 

GTCCTGTCTA AAACCTATAC TCATTCGGAT GGGCAGTGGG GCTGGATAGA TTTGGTGTTC 180 

GTTATCCTTG ACGGCAGCTC C0GCGAT7TG GGTACGGCCT ATGATTTCTT GAGGGATGTT 240 

ATCCTTAAAA TGATTGATC 2 c q 
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(2) INFORMATIONS POUR LA SEQ ID NO: 12: 

( i I CARACTERISTIQUES DE LA SEQUENCE : 

(A) LCNGUEUR. 4 36 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE 2RINS: simple 
(Dj CONFIGURATION: iineaire 

Hi) TYPE DE MOLECULE . ADN (genomique) 

(vi) CRIGINE . 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE. Z2491 

(xi : DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 12: 
GATCAAATGG ATGATTTATA TAGAATTTTC TTTTACGACT GCGTGCCGTT TGAAAAGAAA 60 

ATGCACAATC CCGTATCTCA TCGTGCCATA GATTTTTCAA AGACTCCGGA AGCCATATTT 120 

CGTTGCAATC TGCATACCGA ATTGAAGAAG AAGCGTAAAT TAGCGTTACG TTTAGGCAAG 180 

CTGTCGG ACA ATACAGCATG GATATTAAAA CCCCAAGTCA TGAAAAATCT TCTGAAAAAC 24 0 

CCSTCAACTC AAATTACGGA AAAOGATGTC GTGCTCGATG TTAAACAAAA AGGTGTAGAT 300 

ATGCCTATAG GCTTGGATAT TTCATCTATT ACCTTAAAAA AACAAGCCGA TAAAATCATC 360 

TTGTTTTCTG GTGATTCCGA TTTTGTCCCA GCAGCCAAAT TAGCCAGACG GG AAGGTATC 4 2C 
GAT7TTATTC TTGATC 

(2) INFORMATIONS POUR LA SEQ ID NO: 13: 

( i) CARACTER I STI QUES DE LA SEQUENCE: 

(A) LCNGUEUR: 36 3 paires de bases 
(9) TYPE: nucleotide 
(CJ NOMBRE DE BRINS: simple 

(D) CONFIGURATION : Iineaire 

(li) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINS : 

(A) ORGANISME: Neisseria meningitidis 
(3) SOUCHE: 22491 



436 
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(:<D DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13: 
CA7CGT7TTA CGTCGCAATC GAGC7TTGTG GTGCGCTC3C CTAAAAGCCA ATCTTCrrTC 50 

AATGGCCTGG GTGCCATTTT GCAGGGCACA GGT7TTGCCC GTGCGCAAGA CGATATTTAT 120 

ACCGTGCAGG AATATATGCA GTCGCGTTCG GCTTTGGATG CGTTGCGTAA GAAAATGCCC 180 

ATTCGCGATT T7TATGAAAA AGAAGGCGAT ATTTTCAG CC GTTTTAATGG TTTTGGCCTG 240 

C3TGGCGAGG ATGAGGCGTT 7TATCAATAC TACCGTGATA AGGTATCCAT CCAT7TTGAC 300 

TCTG7CTCAG GCATTTCCAA T7TGAGC3TT ACATCGTTTA ATGCCGGTGA ATCTCAAAAG 360 



363 



ATC 

(2) INFORMATIONS POUR LA SEQ ID NO: 14: 

(i) CARACTERISTICUES DE LA SEQUENCE . 

(A) LONGUEUR: 314 paires de bases 

(B) TYPE : nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 
(3) SOUCHE: Z2491 

(XI) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 14: 

GATCTTGGGT CATTTATATC TTCACOGATA TTGCAATTAC CGCCGTTCCA GTTGAAATAA 60 

CAACGACTAA AATTCTAGTT CCTAAAAGAA TCATTCCTAT TCTTGCGTAC CATTTCCCAA 120 

TAATTCCGCC CGACAATTTC CATTTAATGC TCCATCAGTT CTnTACITC CGGAAATCTG 180 

CTGTAATCTG ACATAAGACG CATAATTGAA CTATCAACGC CGTAACAGCC ATAGGTTTTA 240 

ATACOGTTTT CBSCGTGITC CCAAATGCAA TTACTGTATT CGTAGCCTTT TACAAATTTA 300 

TOGGTTTOGG GATC 3l4 



BNSWXia <WO__96C32547A2_L> 



FEWLLE DE REMPLACEMENT (REGLE 2§) 



WO 98/02547 PCT/FR97/01295 

55 

(2) INFORMATIONS POUR LA SEQ ID NO : 15: 

ID CARACTER I ST I CUES DE LA SEQUENCE : 

(A) LONGUEUR: :56 paires de bases 
(3) TYPE, nucleotide 

(C) NOMBRE DE ERINS . simple 

(D) CONFIGURATION lineaire 

(ii) TYPE DE MOLECULE. ADN {gencmiquel 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meninci tidis 

(B) SOUCHE: 22491 

(XX) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 15: 

G ATCAT A CG A ATCTACCCTA AAATACCCCO TCGCCGATTT AGGATTGGCT ACATAAAGCT 60 

CATTATAAGG GTATTTTGAT GACATGATAC GGTTAAATTC ATTGCCGTTG TTTATCCTGA 120 

TTCTATAAAT TGGTTCAACA GCAAAGCCTC TGGATTCCCT TAATTGATTA TAATATTGCC 180 

TGTA T5TTTG TACATCATGT CTTGTCCACG GCTCTCCAGG AGTCCTCAGA ATAGCAATCC 240 

CGTTAAATTT CGGATC 256 
(2) INFORMATIONS POUR LA SEQ ID NO: 16: 

(l) CARACTER I ST I QUES DE LA SEQUENCE : 

(A) LONGUEUR: 235 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BR INS . simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(vi J ORIGINE: 

(A) ORGANISME. Neisseria meningitidis 

(B) SOUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 16: 
GATCCACGCC TGTGCCTACC TTGGC7TTTT GTTCGCCAAA CAAGGCATTT AAGGTTGAGG 60 
ACTTGCCGAC ACCTGTOGCA CCGACAAGCA AG A CATC CA A ATGACGGAAA CCGGCTGCTG 120 
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7GACTTTTTG CCCGATTTCA GAAATACGGT AACGATGCAT ATCCGCTCC7 ACCAGCCAAA 130 

AAAAGAAGCA ACCGTGCTAA TCGCCCCTCC AATCGCTTTT GCAGCACCGC CGATC C3S 

(2) INFORMATIONS POUR LA SEQ ID NO: 17: 

i i ) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 259 paires de bases 
(3) TYPE: nucleotide 

(C) NOME RE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

Ui) TYPE DE MOLECULE: ADN (genomique) 

(vi J ORIGINE. 

(A) ORGANISME: Neisseria meningitidis 
(3) SCUC-E: 22491 

;xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 17: 

GATCCAACGG GCATCGCTGT CCTTACTCGG TGTGGTTTGA CCGCTGATTT GTC CTTCTT C 60 

GTCAACTTCT ATGGCCTGAC G CTGTTTG C7 GCCGGOGGTC TGGATAATGG TGGCATCAAC 120 

GACGGCGGCG GATGCTTTCT CTATTTTTAG GCCTTTTTCG GTCAGTTGGC AGTTAATCAG 180 

TTTGAGTAAT TCGGACAGGG TGTOGTCTTG CGCCAGCCAG TTGCGGTAGC GGCATAAGGT 24 0 

ACTGTAATCG GGGATGATC 259 

(2, INFORMATIONS POUR LA SEQ ID NO: 18: 

(i) CARACTER I STI QUES DE LA SEQUENCE: 

(A) LONGUEUR: 201 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: 22491 
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(xi) DESCRIPTION DE LA SEQUENCE. SEQ ID NO: 18: 
GATCTGTG CC GTTGATTTTA TCTTTCAGAT GCAGCATCGA ATATCGGAAA GCCAAATCAG 6 0 
CAATTCTTTT TGCATCGTGT GGATTTTGAG ACGGGCCTAA TGACCGTACC CGCTTAATAA 120 
AAAATGCACC GTCAATCAAA ATGGCGGTTT TCATATTCCT TCCCCTATAT TTGTCAAAGA 130 
TATA AAA A AG CCdTGGGAT C 201 
(2) INFORMATIONS POUR LA SEQ ID NO: 19: 

(ij CARACTERI S7I QUES DE LA SEQUENCE: 

(A) LONGUEUR: 334 paires de bases 

(B) TYPE : nucleotide 

iC) NOMBRE DE BR INS : simple 
(D) CONFIGURATION: iineaire 

(ii) TYPE DE MOLECULE : ADN (g6nomique) 

(vi} CRIGINE: 

(A) ORGANISMS: Neisseria meningitidis 

(B) SOUCHE: 22491 

(Xi] DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 19: 

AATTCAAAGG AGGCATTTGT TGCAAGAAAA GTACAAAGTG ATTTGCAAAA AGCATTGAAT 60 

GCTAGCAACT ATAACAAGCA GCAATATGCA AGACGTG CGG CAACAGCGTT AGAGAATCCT 12 0 

TCAAAATCAA AAGTTATGGC AGCGAATTCT TTTTGATCTA TCTTGTCCGA ACGGGTCAAA 180 

TATTCTTCGT ACATTGAGTT AATCGTACCA ATCGCCCTAA CCACATTTTC ATCAGAAAAT 24 0 

ATGGAAATAA TAGCATCCCT ATACGCACCT AGTGTAATAT TGTTTCTATT ATTAGTTATA 300 

GCATTATTCG AATACATAAT AGCACCTCCA AATT 334 
(2) INFORMATIONS POUR LA SEQ ID NO: 20: 

( i ) CARACTERI STIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 238 paires de bases 

(B) TYPE: nucleotide 

iC) NOMBRE DE BRINS : simple 
(D) CONFIGURATION: iineaire 
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(iii TYPE DE MCLECULE: ADN (aenornique) 

(vi) CRIGINE: 

(A) ORGANISME : Neisseria meningitidis 

(B) SOUCHE: 22-191 

(:<i) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 20: 

AATTCCTGCG CACCTTTGCC GATGGGGAGA TAATCGCCTT TTTGCAGCAT TCTGCCCTGA 60 

TGGCCGCCGA AACCGGCT7T CAGGTCGGTA CTTCTCGAAC CCATCACTTC CGGCACATCA 120 

AATCCCCCCG CCACGCACAC ATAGCCGTAC ATCCCCTGCA CGGCACGCAC CAGTTTCAAG 180 

GTCTGCCCTT TGCGGGCGGT ATAACGCCAA TACGAATAGA CCGGTTCGCC GTCCAATT 238 
(2) INFORMATIONS POUR LA SEQ ID NO: 21 : 

(i) CARACTZRISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR. 249 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineal re 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: 22491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 21: 

AATTGGGCGA GATGCTGCOG GAAAOGGATT TAAAACAGAT TGCGGCGGCA GTGTTGAAGA 60 

CGAACGATGA GGCGGCATTG CAGAAGGTGG TGAAAACGGC CAAAGGCAAT GCGCGGAAAC 120 

TGTCGAAGCT GCTGCTGATT GTCGACTATT 7CTTGCAGGT TAACCCTGAT GTTGATTTGG 180 

ATGATGATGT AATOGAACAC GCGGAAACCT ATTTAATCCA CTAAACCTTT GACAGATAAG 240 

GCAATAATT 24$ 
(2) INFORMATIONS POUR LA SEQ ID NO: 22: 
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ID CARACTERISTIQUHS DE LA SEQUENCE 

(A) LONGUEUR: 212 paires de bases 

(B) TYPE: nucleotide 

(C) NOMERE DE BR INS : simple 
(Dl CONFIGURATION: lineaire 

In) TYPE DE MOLECULE: ADN (genomique) 

|vi) CRIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: 22491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 22: 

AATTTATGTA CGGTTTTGCC GTTTGCAGTC AGCCAGTCGG CAAGGCGCAG AAAAAAATCG 60 

CCG ACAGGGC CTTGAAGCAG CAGGATATTT TCTGCGCTTT CAAGCAGGTT TTGCAGGTTA 120 

TTTTTGAGGA CGGTCTGTTT CATGTTGCAA TGTGGTTTTG TTTTTTATGT AATAGTTTTA 180 

GGTTGAACTT TCAAGCATAC GCCAAGAGAA TT 212 
(2) INFORMATIONS POUR LA SEQ ID NO: 23: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 227 paires de bases 

(B) TYPE: nucleotide 

(C> NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(li) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME : Neisseria meningitidis 
(3) SOUCHE: 22491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 23: 

AATTCAGTCC CT G OCTCATA TCACGGCTAC CTTGTGGTTC AGGGTTACTG TATCGCCCGC 60 

GGCATCGACG GCTTCAATAT GCAGCTTCAG CCAGCCGTGC TGCGGGGCGG ATGCGGTTAC 120 

TTGGATGGAT TGGGCGCGTT TGGACTGAAT CACGGGCTGC AAGGCTTGCT CGGCGTACTG 180 

TTTGGCCAGT ACTTCGATGC GCTTTAAATG CTTTTGGCGG CGCAATT 227 
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(2) INFORMATIONS POUR LA SEQ ID NO: 24: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR : 167 paires de bases 

(B) TYPE: nucleotide 

(C) NCMBRE DE BR INS: simple 
(DJ CONFIGURATION: Imeaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINS: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE. Z2491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 24: 
GATCCAGGAC TCAAAAACCG ATTTCCTAAT AGAGTCTCTA ATATCCCAAT CTTTTTTA CC 60 
CCCTCTGCTG TAGAATTGAT AGAGAAAGTT TGTCTATCTT TTTCATATAC CCATGCCTTC 120 
TTTTTATCAT TGTAGCTAAC ATAACCGCCA AACAATGCTT CTAGATC 167 
(2) INFORMATIONS POUR LA SEQ ID NO: 25: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

( A) LONGUEUR: 251 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BR INS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINS: 

(A) ORGANISME : Neisseria meningitidis 

(B) SOUCKE: 22491 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 25: 

AATTCTTGOG GCCATTTCCT GAATGGCTTT AGTCAAAACG GGGATGAACG TTTCGTATTC 60 

GAOGGTGTAG GTATOSTTTG TTTTATTTAC CATCGGCAAT CGACCATATT CATCITCCAG 120 

OGCAGCAATG TCCTGGGCAA TAAACCAATG CCGCAACOGA TCTTCTTTAT GACIGCCGTC 180 
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CTTCATTGGA TTCGCCCACC ATTCGCGGAC Ti TGTCC3C? CGTTCA7CTG CCGGCAAGTC ZAO 
TTTGAATAAT T 251 
(2) INFORMATIONS POUR LA SEQ ID NO: 26: 

(;) CARACTtRISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 207 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(vi) ORIGINE: 

[A) CRGANISME. Neisseria meningitidis 
(BJ SCUCKE: 22491 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 26: 

AATTCCCGAC TATCGCGGAT GCGTAGTTTT TGCCGGTGGG CAAGAGCAGG TGTGGGATAA 60 

GTTAGGTGAT TTGCCCGATG GCGTCAGCCT GkCCCCGCCT GAATCGGTAA ATATTGACGG 120 

CTTAAAATCC GTAAAACTCG TC3CATTAAA TGCTGCCGCT CAGGCTTTTA TTAACAAGCA 180 

CGCCGGTATC GACAGCGTAC CTGAATT 207 

(2) INFORMATIONS POUR LA SEQ ID NO: 27: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 379 paires de bases 

( B) TYPE : nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(vi) ORIGINE: 

(A) ORGAN IS ME : Neisseria meningitidis 

(B) SQUCHE: 22491 

(XI) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 27: 
AATTGTTTGG GAATAATCCA AACAAACAGC ATCAGGATAG OGGCGGCGGT CAGGCTGCCT 60 
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GAAAGGATTT TGCCGGGGTT H ITCTAGGC AAAGC5GAC3 AGAAACCAAA GCAACACCAG ICO 

CATGGTGTCC CAATAGCCGA TTGAGAATAG GATGGCCAAA CCTTC7AGGA AATGGCGTAA 130 

ATCGTTTGTG GTAACCATGG GTAGTTCCTG TGGTTAAATG TGCAGGCTGC TTTTTGCCGA 24 0 

ACC77GCCGC ATCTCAAAAG CAGCCTGCGC TTCAGCGTTG CGTTACGCAG TAAAATAATG 300 

AATATTTGTA AOGGCTTGGG TATTTTTTGT CAATATTCCC GCCCTTCCCT TAACAGCTGC 360 

CGCGCTTTCC GTTAAAATT 379 
(2) INFORMATIONS POUR LA SEQ ID NO: 28: 

(i) CARACTERISTIOUES DE LA SEQUENCE: 

(A) LONGUEUR: 274 pair as de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi| ORIGINE: 

(A) ORGANISMS: Neisseria meningitidis 

(B) SOUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 28: 

AATTCGCCGA AATCAGGCTG CTGCTCGATA ATOGGCGCGG CCGATTGGCG TTGTGCCTOG 60 

ATTAAATCCA TC7TGTCTTG CAGACGTTTG GCCTGGCCTT TGCGGCGGC3 TTCGGCCAGT 120 

TGTTCCATCC GOGTTTCOGC AAATGCCGCC CGTTTGTTGC CGTTGAATAC OGCTTTGCAA 180 

ATCACCTTCC CCTGCATATC CTTCACAATC ACATGGTCGG CATCGTGGAT GTCGTAAGCC 240 

ACCCGTACCT TCTGACCGCT GTAATCCAGC AATT 274 
(2) INFORMATIONS POUR LA SEQ ID NO: 29: 

(i) CARACTERISTIOUES DE LA SEQUENCE: 

(A) LONGUEUR: 263 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
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(D) CONFIGURATION : lineaire 
(li) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 
(3) SOUCHE: 22491 

(XI) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 29: 

AATTCCGTTC TTATTGGGCT TTTTCCATCC ATCGGGTATG CCTGAAGGGA ACGCAAACCC 60 

TGCCACTTGC CCXVCGCTCC ATTCCCGCAT TAGCGCGTCT GACGGCAAGT GTTCTCGCGC 120 

CCAATCAAGC CACGCOGCC GCATTGCGGC CTTGTCCTGC TGAAAACTTC GCAGTGCTTT 180 

TGCAACCGGC CCATCATTAA CTTCAATCAA ATAAATCATT ATATTTGCGT TCATTTTT CC 240 

TACACCTTCG CCACATCCAA ATT 2oJ 
(2) INFORMATIONS POUR LA SEQ ID NO: 30: 

(i ) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 316 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS . simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUmE: 22491 

ixi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 30: 

AATTGTTCAA GAAAAAAGTC GGCAOGGCGC GGCAACGGGG AAAATGCGTT GACGCCGTCT 60 

TTTTCTAAGG TGATGTAGTA GGGGCGGAAA TAGCCTTCTT CAAACGCCCA GAAACTGGCT 120 

TGGTTTTCGT TTGCAATGOG TTTTGCAATG AOGTGATAAG GGCGTGTGTC GCCAAAGCAG 180 

ACAACGGCCT GGATGTGATG TTGAGTGATG TATTCTTGCA AAAACTCAGG AAAGGCGTOG 240 

TAGTTGTCGT TAAAAACAAC GGTATGCGCT TGAGTGGGCG GATAAAAATA GTCGTCGCCT 300 
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GCATTAAAG7 TGAATT 316 

(2) INFORMATIONS POOR LA SEQ ID NO: 31: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 324 paires de bases 
;B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genoraique) 

(vi) ORIGINE: 

;A) ORGANISME: Neisseria meningitidis 
(BJ SOUCHE: Z2491 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 31: 

AATTCAATCA ACGGAAAACA CATCAGCATC AAAAACAACG GTGGTAATGC CGACTTAAAA 60 

AACCTTAACG TCCATGCCAA AAGCGGGGCA TTGAACATTC A1TCCGACCG GGCATTGAGC 120 

ATAGAAAATA CCAAGCTGGA GTCTACCCAT AATACGCATC TTAATGCACA ACACGAGCGG 180 

GTAACGCTCA ACCAAGTAGA TGCCTACGCA CACCGTCATC TAAGCATTAC CGGCAGCCAG 24 0 

ATTTGGCAAA ACGACAAACT GCCTTCTGCC AACAAGCTGG TGGCTAACGG TGTATTGGCA 300 

CTCAATGCGC GCTATTCCCA AATT 324 

(2) INFORMATIONS POUR LA SEQ ID NO: 32: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 230 paires de bases 
(B} TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUQtE: 22491 
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Ui) DESCRIPTION tS LA SEQUENCE ' SEQ ID MO: 32: 

AATTA7GCAA AAAAAC3CAA CGCCGAAAAA CTCGCACCGC GCGGATATTG TTGCTGCT77 60 

GAAAAAGAAA GGCTGGTCAC T7CCAGCAC7 TTCAATAGAA GCGGGGTTGT C3CCG AATAC 120 

GCTTAGAAGC GCAC7GGCC3 CZCCTTATC7 TAAGGGAGAA AGGATT ATTG CCGCTGCAAT ISO 

CGGAGTGGAA CGGGAAGAGA 7T7GG7CCGA ACGGTATGCA GATCGGAATT 230 

(2) INFORMATIONS POUR LA SEQ ID NO: 33: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LCNGUEUR: 249 pa; res de bases 
(2) TYPE: nucleotide 

(C) NCMBRE BRINS simple 

(D) CONFIGURATION : lineal re 

til) TV? I DE MCLECJLE: ADN (genomique) 

(vi) CRIGINE : 

(A) CRGANISME: Neisseria meningitidis 
(Bl SCUCHE: 22491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 33: 

AATTTAATCG GTGGAATGCC TGTTCAACCG CACCAATCCC GCTGAATACG GTTGCTAATC 60 

TAATATGTGA ATCAGGTTTA AGAAAAGTTT TAGATTTCCA ACCTTGTTGA CTGGGAAAGA 120 

GCAAAGTTTT TTGTAATCGA GTATCGTGTG TCTGTGCCAT TGTCGAAATA GTCATACTTA 180 

TATCGTTCTG TTTATCTTAT CAATATGAAA ACTACATCGT TGATTGCCCT GACAATGCCT 2 40 

TGGTCAATT 249 
(2) INFORMATIONS POUR LA SEO ID NO: 34: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LCNGUEUR: 343 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

UD TYPE DE MOLECULE . ADN (genomique) 
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(vii ORIGINS: 

(A) ORGANISMS : Neisseria meningitidis 
(5) SOU CHE. 32-151 

tXD DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 34: 

AATTCTTGTC CCGGAGTCCA AC3TATATTT ACCCTCCTGC GAGCTAAAAG ACT ATT ATT C 50 

TCCACTGCCA CAGTAGCCGC ATTCACCGCC GTATTCACAT CCCCTTTAAC CAATGCCACT 120 

GCGCTGCCTG CGATAATCTG CG AGTAGGCT ATGACTT7TT GGCGTTC7TG GGGTGACAGT 180 

TTGCCTACAT CGCGTCCGTC CAACAGGGTT TCTCCCACCA TCTCGCCGAC TGCCGCGCCG 240 

ATTGC3CCGT CCCGACATTT GCCTTTATTT GCTACCGCCG ATGCACAGCC TGCTACGGCA 300 

TCGGCTATCT TGTGGGCAAT GTAGTCTTCG C7GAGATTAA ATT 34 3 

(2) INFORMATIONS POUR LA SEO ID NO: 35; 

(i) CARACTZRISTIQUES DE LA SEQUENCE: 

<AJ LONGUEUR : 184 paires de bases 
(BJ TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lindaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A| ORGANISME: Neisseria meningitidis 
(3) SOUCHE: Z249I 

(Xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 35: 

AATTCTTCAA ACATCGTTTC GATAATCGGG TOGGTGTACA CACTGATGCG GTOGCCCGCA 60 

CGGCTTTGAC CGGCTCGGAA AATATAGGCG GTGGCTTTGC CGTCGGCGAT GTOGAOGCAC 120 

CAACGCCAGA TGGCGTCTTC GGTATTCAAA CAATCACCCG CACAGCTTTC ACCTGCGCGG 180 

AATT 184 

(Xi) DESCRIPTION DE LA SECUENCE: SEO ID NO: 36: 
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TATGCTCAAT CTCATTTTCA AAATGCAAAA CTTTTCTGAT TTTTCCTACT TTT7GC7CAA 
TATTAGGAAG GTTTTAG3CA ATTGAAAATT TTTTGGCGCA TT7TTATGCG TCAAA7TTC3 
TTAACAGACT ATTTTTGCAA AGG7CTCC3T C7GTAAAAGC AAGGATAGGG CATCTGCCCT 
7TTGATTGT7 TGATTAACGA TACAAGGAGT TTCAAAATGA GAGTTTTATA GTGGA7TAAC 240 _ 
AAAAACCAGT ACAGCG7TGC CTCGCCTTGC CGTACTATTT G7ACTGTCTG CGGCT7CG7C 300 
GCCTTGTCCT GATTTAAATT TAATCCACTA TATGTGTTCA TGAAATGACT 7GGGTCGGAG 360 
GCTCAGGTAA TGCGCAACAA AGTTCATATT ATTGCGAAAT TTGCGAATCT GCAGGGCTTA 420 
ACGATACGGG AAATCCTGAT AAATCTTTAG GATTCCCAAA CAATACGTTC AGTAATCC3C 480 
CTC-GTTGGGG AGCTACAATC GGAGCTTTAG CACCTAGCC3 CATAGG7ATG CCTGAATTTG 540 
GTACGTTTGC GAGCCATGCC ATTGAAAATT TCGACTGGTC ATGGTATCGA CGTTATAGGG 600 
AAATTGCGGA AACGATTGAA CGAGAATATT CAGGCGG7TT GCCTTAATAG TTGAGGAGGT 660 
CATGATGTTT GCGAAACATT ATCAATTCAT CGCACTCGGC ATCATGCTGC TTCTTTATAT 
GTTGATTCTC TATACGACCG ATTTTTCCAA TCTGACGTAT TGGATGCTGT TTTTTATCTG 
TTTTATTACA GGAAAAATAT TAGCTCCTTT GTTAGAGAAA AGCTTTAAAT AAAATAGCAG 
CTAG7CGCAA AAGGTCGTCT GAAACCTTTT CAGGOGGCCT TTCTAAAATA CATCCAACTT 
CCTAATCCCT ATTTTTCAAA AAGGAAATCT ATCCCCCATC TCCAAAACCT GTCTTTGGGC 
TTAAACAAAA AGCTGCCTGT TATCCTGCAA ACAGAAATAT CAGAATGCGG CTTGGCATGT 1020 
CTGGCGGCTG TGGCGGGATT TCATGGTT7C CATAGGAATT TACGCGCACT GCGTTCAAAA 1080 
TACTGTCCGA GACCTTTGCA AAATTCCCCA AAATCCCCTA AATGTCITGG TGGGAATTTT 1140 
GGGGAATTTT GCAAACGTCT CATTCTATAA CTGTAAATAC TTTTAAATTT ATGACAAAAT 1200 
AGTAAATATT GCTAAAATAA TATTGATGTC ATGAAATTTT TTCCTGCTCC ATGTCTGTTG 1260 
GTTATCCTGG CTGTCATACC CGTTAAAACC TTAGCTGCCG ATGAAAACGA TGCAGAACTT 1320 
ATCCGTTCCA TGCAGCGTCA GCAGCACATA GATGCTGAAT TGTTAACTGA TGCAAATCTC 1380 
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CGTTTCGAGC AACCATTGGA GAAGAACAAT TATGTCCTGA GTCAACATGA AACACCGTCT 1440 

ACTCGGGTAA ATTACATTAG TTTAGATGAT AAGACGGCGC GCAAATTTTC TTTTCTTCCT 1500 

TCTGTGCTCA TGAAAGAAAC AGCTTTTAAA ACTGGGATGT GTTTAGGTTC CAATAATTTG 15 60 

AGCAGGCTAC AAAAAGCCGC GCAACAGA7A CTGATTGTGC GTGGCTACCT CACTTCCCAA 16 20 

GCTATTATCC AACCACAGAA TATGGATTCG GGAATTCTGA AATTACGGGT A7CAGCAGGC 1680 

GAAATAGGGG ATATCOGCTA TGAAGAAAAA OGGGATGGGA AGTCTCCCGA GGGCAGTATT 17 4 0 

AGTGCATTCA ATAACAAA77 TCCCTTATAT AGGAACAAAA TTCTCAATC7 TCGCGATGTA 1800 

GAGCAGGGCT TGGAAAACCT GCGTCGTTTG CCGAGTGTTA AAACAGATAT TCAGATTATA 1860 

CCGTCC3AAG AAGAAGGCAA AAGCGATT7A CAGATCAAAT GGCAGCAGAA TAAACCCATA 1920 

CGGTTCAGTA 7CGGTATAGA TGATGCGGGC GGCAAAACGA CCGGCAAATA TCAAGGAAAT 1980 

GTCGCTTTAT CGTTCGATAA CGCTTTGGGC TTAAGOGATT TGTTTTATGT TTCATATGGA 2040 

CGCGGTTTGG TGCACAAAAC GGACTTGACT GATGCCACCG GTACGGAAAC TGAAAGCGGA 2100 

TCCAGAAGTT ACAGCGTGCA 7TA77CGGTG CCCGTAAAAA AATGGCTGTT TTCTTTTAAT 2160 

CACAATGGAC A7GG77ACCA CGAAGCAACC GAAGGCTATT CCGTCAATTA CGATTACAAC 2220 

GGCAAACAAT ATCAGAGCAG CCTGGCCGCC GAGCGCATGC TTTGGOGTAA CAGGTTTCAT 2280 

AaAACTTCAG 7CGGAATGAA ATTATGGACA CGCCAAACCT ATAAATACAT CGACGATGCC 2340 

GAAATCGAAG TGCAACGCOG CCGCTCTGCA GGCTGGGAAG CCGAATTGCG CCACCGTGCT 2400 

TACCTCAACC GT7GGCAGCT TGACGGCAAG TTGTCTTACA AAOGCGGGAC CGGCATGGGC 24 60 

CAAAG7ATGC CCGCACCTGA AGAAAACGGC GGOGGTACTA TTCCAGGCAC ATCCCGTATG 2520 

AAAATCATAA CCGCGGGATT GGATGCAGCG GCCCCGTTTA TGTTGGGCAA ACAGCAGTTT 2580 

TTCTACGCAA CCGCCATTCA AGCTCAATGG AACAAAACGC CTTTGGTTG C CCAAGACAAG 2640 

TTGTCTATCG GCAGCCGCTA CACCGT7CGC GGATTTGATG GGGAGCAGAG TCTTTTCGGA 2700 



BNSOOCIO: <WO 9802647 A2_l_> 



FEU1LLE DE REPLACEMENT (REGLE 2§) 



WO 98/02547 PCT/FR97/01295 

69 

GAGCGAGGTT TCTACTGGCA GAATACTT7A ACTTGGTATT T7CATCCGAA CCATCAGTTC 27 60 

TATCTCGGTG CGGACTATGG CCGCGTATCT GGCGAAAG7G CACAATATCT ATCGGGCAAG 23 20 

CAGCTGATGG GTGCAGTGGT OGGCTTCAGA GGAGGGCA7A AAGTAGGC3G TATGTT7GC7 2 3 30 

TATGATCTGT TTGCCGGCAA GCCGCTTCAT AAACCCAAAG GCTTTCAGAC GACCAACACC 29 AO 

GTTTACGGCT TCAACTTGAA TTACAGTTTC TAACCTCTCA ATTTTTTTAC TGATATTTAG 3000 

ACGGTCT7TC CTTATCCTCA GACTGTCAAA CTTTACCTAC GTACTTGGCG CGCAGTACGT 30 60 

TCATCTTCAA AA7GGAATAG ACATGAATAA AGGTTTACAT CGCATTATCT TTAGTAAAAA 3120 

GCACAGCACC ATGGTTGCAG TAGCCGAAAC TGCCAACAGC CAGGGCAAAG GTAAA CAGGC 3180 

AGGCAGTTCG .GTTTCTGTTT CAC7GAAAAC TTCAGGCGAC CTTTGCGGCA AAC7CAAAAC 3 2 40 

CACCCTTAAA ACCTTGGTCT GCTCTTTGGT TTCCCTCAGT A7GGTATTGC CTGCCCATGC 3 300 

CCAAAT7ACC ACC5ACAAAT CAGCACCTAA AAACCAGCAG GTCGTTATCC TTAAAACCAA 3360 

CACTGGTGCC CCC77GGTGA ATATCCAAAC TCCGAATGGA OGCGGATTGA GCCACAACCG 34 20 

CTATACGCAG TTTGATGTTG ACAACAAAGG GGCAGTGTTA AACAACGACC GTAACAATAA 3 480 

TC Lblll CTG GTCAAAGGCA GTGCGCAATT GATTTTGAAC GAGGTACGCG GTACGGCTAG 354 0 

CAAACTCAAC GGCATCGTTA CCGTAGGCGG TCAAAAGGCC GACGTGATTA TTGCCAACCC 3600 

CAACGGCATT ACCG7TAATG GCGGCGGC7T TAAAAATCTC GGTCGGGGCA TCTTAACTAT 36 60 

CGGTGCGCCC CAAATCGGCA AAGACGGTGC ACTGACAGGA TTTGATGTGC GTCAAGGCAC 3720 

ATTGACCGTA GGAGCAGCAG GTTGGAATGA TAAAGGCGGA GCCGACTACA CCGGGGTAC7 37 80 

TGCTCGTGCA GT7GC77TGC AGGGGAAATT ACAGGGTAAA AACCTGGOGG TTTCTACOGG 3840 

TCCTCAGAAA GTAGATTAOG CCAGCGGCGA AATCAGTCCA GGTACGGCAG CGGGTAOGAA 3900 

A CCG ACT ATT GCCOTGATA CTGCCGCACT GGGCGGTATG TAOGCCGACA GCATCACACT 3960 

GATTGCCAAT GAAAAAGGCG TAGGOGTCAA AAATGCOGGC ACACTCGAAG OGGCCAAGCA 4020 

ATTGATTCTG AC7TGGTCAG GCCGCATTGA AAACAGOGGC G3CATCGCCA CCACTGCCGA 4 080 
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CGGCACCGAA GC7TCACCGA CTTATCTCTC CATCGAAACC ACCGAAAAAG GAGCGGCAGG 4 h 0 

CACATTTATC TCCAATGGTG GTCGGATCGA GAGCAAAGGC TTATTGGT7A TTGAGACGGG 4200 

AGAAGATATC AGCTTGCGTA AC3GAGCCG7 GGTGCAGAAT AACGGCAGTC GCCCAGC7AC 4260 

CACGGTATTA AATGCTGGTC A7AA777GG7 GATTGAGAGT AAAACTAATG TGAACAATGC 4 320 

CAAAGGCTCG GCTAATCTGT C3GCCGGCGG TOGTACTAOG ATCAATGATG CTACTATTCA 4 380 

AGCGGGCAGT TCCGTGTACA GCTCCACCAA AGGCGATACT GAATTGGGTG AAAA7ACCCG 4 J 40 

7ATTATTGCT GAAAACGTAA CC37A77A7C TAAOGGTAGT ATTGGCAGTG CTGCTGTAAT 4 500 

TGAGGCTAAA GACACTGCAC ACATTGAATC GGGCAAA CCG CTTTCTTTAG AAACCTCGAC 4560 

C5T7CCC7CC AACATCCGTT TGAACAACGG TAACATTAAA GGCGGAAAGC AGC77GC777 4 6 20 

ACTGGCAGAC GA7AACA77A CTGCCAAAAC TACCAATCTG AATACTCCCG GCAATCTGTA 4 680 

TGTTCATACA GGTAAAGATC TGAATTTGAA TGTTGATAAA GATTTGTCTG CCGCCAGCAT 4 74 0 

CCA7T7GAAA TCGGATAACG CTGCCCATAT TACCGGCACC AGTAAAACCC TCACTGCCTC 4 800 

AAAAGACATG GGTGTGGAGG CAGGCTTGCT GAATCTTACC AATACCAATC TGCGTACCAA 4 860 

CTCGGGTAAT CTGCACATTC AGGCAGCCAA AGGCAATATT CAGCTTCGCA ATACCAAGCT 4 9 20 

GAACGCAGCC AAGGCTCTCG AAAC2ACCGC ATTGCAGGGC AATATCGTTT CAGACGGCCT 4 980 

TCATGCTGTT TCTGCAGACG GTCATGTATC CTTATTGGCC AACGGTAATG CCGACTTTAC 5040 

CGGTCACAAT ACCCTGACAG CCAAGGCCGA TGTCAATGCA GGATCGGTTG GTAAAGGCCG 5100 

TCTGAAAGCA GACAATACCA ATATCACTTC ATOTCAGGA GATATTAGGT TGGTTGCCGG 5160 

CAACGGTATT CAGCTTGGTG ACGGAAAACA ACGCAATTCA ATCAACGGAA AACACATCAG 5220 

CATCAAAAAC AACGGTGGTA A7GCCGAC77 AAAAAACCTT AACG7CCA7G CCAAAAGCGG 5280 

GGCATTGAAC ATTCATTCOG ACCGGGCATT GAGCATAGAA AATACCAAGC TGGAGTCTAC 5340 

CCATAATACG CATCTTAATG CACAACACGA GCGGGTAACG CTCAACCAAG TAGATGCCTA 54 00 
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CGCACACCGT CATCTAAGCA T7ACCGGCAG CCAGATTTGG CAAAACGACA AACTGCCTTC 5460 

TGCCAACAAG CTGC7GGC7A ACGGTGTATT GGCACTCAAT GCGCGCTATT CCCAAATTGC 5520 

CCACAACACC ACGCTGAGAG CGGGTGCAAT CAACCTTACT GCCGGTACCG CCCTAGTCAA 558 0 

CCGCGGCAAC ATCAATTGGA GTACCGTTTC GACCAAGACT TTGGAAGATA ATGCCGAATT 5640 _ 

AAAACCA7TG GCCGGACGGC TGAATATTGA AGCAGGTAGC GGCACATT AA CCATCGAACC 57 00 

t 

TGCCAACCGC ATCAGTGCGC ATACGGACCT GAGCATCAAA ACAGGCGGAA AATTGCTGTT" 57 60 

GTC7GCAAAA GGAGGAAATG CAGGTGCGCC TAGTGCTCAA GTTTCCTCAT TGGAAGCAAA 5820 

AGGCAATATC CGTCTGGTTA CAGGAGAAAC AGATTTAAGA GGTTCTAAAA TTACAGCCGG 58 8 0 

TAAAAACTTG GTTGTCGCCA CCACCAAAGG CAAGTTGAAT ATCGAAGCCC TAAACAACTC 59 4 0 

A7TCAGCAAT TATTTTCCTA CACAAAAAGC GGCTGAACTC AACCAAAAAT CCAAAGAATT 6000 

GGAACAGCAG ATTGCGCAGT TGAAAAAAAG CTCGCCTAAA AGCAAGCTGA TTCCAACCCT 606 0 

3CAAGAAGAA CGCGACCGTC TCGCTTTCTA TATTCAAGCC ATCAACAAGG AAGTTAAAGG 6120 

TAAAAAACCC AAAGGCAAAG AATACCTGCA AGCCAAGCTT TCTGCACAAA ATATTGACTT 6180 

GATTTCCGCA CAAGGCATCG AAATCAGCGG TTCCGATATT ACCGCTTCCA AAAAACTGAA 624 0 

CCTTCACGCC GCAGGCGTAT TGCCAAAGGC AGCAGATTCA GAGGCGGCTG CTATTCTGAT 63 00 

TGACGGCATA ACCGACCAAT ATGAAATTGG CAAGCCCACC TACAAGAGTC ACTAOGACAA 6360 

AGCIGCTCTG AACAAGCCTT CAOGTTTGAC OGGACGTAOG GGGGTAAGTA TTCATGCAGC 64 20 

TGCGGCACTC GATGATGCAC GTATTATTAT CGGTGCATCC GAAATCAAAG CTCCCTCAGG 6 4 80 

CAGCATAGAC ATCAAAGCCC ATAGTGATAT TGTACTGGAG GCTGGACAAA ACGATGCC7A 654 0 

TACCTTCTTA AAAACCAAAG GTAAAAGCGG CAAAATCATC AGAAAAACCA AGTTTACCAG 6600 

CACCOGCGAC CACCTGATTA TGCCAGCCCC CGTCGAGCTG ACCGCCAACG GTATCA0GC7 6660 

TCAGGCAGGC GGCAACATOG AAGCTAATAC CACCCGCTTC AA7GCCCCTG CAGGTAAAGT 6720 

TACCCTGGTT GOGGGTGAAG AGCTGCAAC7 GCTGGCAGAA GAAGGCATCC ACAAGCACGA 6 78 0 
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GTTGGATGTC CAAAAAAGCC GCCGCTT7A7 CGGCATCAAG GTAGGTAAGA GCAATTACAG 684 0 

TAAAAACGAA C7GAACGAAA CCAAATTGCC TGTCCGCGTC GTCGCCCAAA CTGCAGCCAC 6900 

CCGTTCAGGC TGGGATACCG TGCTCGAAGG TACC5AAT7C AAAACCA CGC 7GGCC3G7GC 6960 

CGACATTCAG GCAGGTGTAG GCGAAAAAGC CCGTGTCGAT GCCAAAATTA TCCTCAAAGG 70 20 

CATTGTGAAC CGTATCCAGT CGGAAGAAAA ATTAGAAACC AACTCAACCG TATGGCAGAA 7080 

ACAGGCC3GA CGCGGCAGCA CTATCGAAAC GCTAAAACTG CCCAGCTTCG AAAGCCCTAC 714 0 

TCCGCCCAAA TTGTCCGCAC CCGGCGGCTA TATCGTCGAC ATTCCGAAAG GCAATCTGAA 7 200 

AACCGAAATC GAAAAGCTGT CCAAACAGCC CGAG7ATGCC TATCTGAAAC AGCTCCAAGT 7260 

AGCGAAAAAC A7CAACTGGA ATCAGGTGCA GCTTGC7TAC GACAGATGGG ACTACAAACA 7 3 20 

GGAGGGCTTA ACCGAAGCAG GTGCGGCGAT TATCGCACTG GCCGTTACOG 7GGTCACCTC 7380 

AGGCGCAGGA ACCGGAGCCG TATTGGGATT AAACGGTGCG GCCGCCGCCG CAACCGATGC 7 440 

AGCATTCGCC TCTTTGGCCA GCCAGGCTTC CGTATGGTTC ATCAACAACA AAGGCGATGT 7500 

CGGCAAAACC CTGAAAGAGC TGGGCAGAAG CAGCACGGTG AAAAATCTGG TGGTTGCCGC 75 6 0 

CGCTACCGCA GGCGTAGCCG ACAAAATCGG CGOTCGGCA CTGAACAATG TCAGCGATAA 7620 

GCAGTGGATC AACAACCTGA CCGTCAACCT AGCCAATGC3 GGCAGTGCCG CACTGATTAA 7680 

TACCGCTGTC AACGGCGGCA GCCTGAAAGA CAATC7GGAA GCGAATATCC TTGCGGCT77 7740 

GGTCAATACC GCGCATGGAG AAGCAGCCAG TAAAATCAAA CAGTTGGATC AGCACTACAT 7800 

AGTCCACAAG ATTGCCCATG CCATAGGGGG CTGTGCGGCA GOGGOGGCGA ATAAGGGCAA 7860 

GTGTCAGGAT GGTGGGATAG GTGCGGCTGT GGGCGAGATA GTCGGGGAGG CTTTGACAAA 7920 

CGGCAAAAAT CCTGACACTT TGACAGCTAA AGAACGCGAA CAGATTTTGG CATACAGCAA 7980 

ACTGGTTGCC GGTACGGTAA GGG G T G T G GT CGGGGGCGAT GTAAATG CGG CGGOGAATGC 8040 

GGCTGAGGTA GGGGTGAAAA ATAATCAGCT TAGGGACAAA GAGGGTAGAG AATTTGATAA 8100 
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CGAAA7GAC7 GCATGCGCCA AACAGAATAA TCC7CAAC7G 7GCAGAAAAA ATACTGTAAA 3160 

AAAGTATCAA AA7C77GCTC ATAAAAGACT TGCTGCTTC3 ATTGCAATAT GTACGGATAT 8 220 

ATCCCGTAG7 AC7GAA7GTA GAACAATCAG AAAACAACA7 T7GA7CGA7A G7AGAAGCC7 8 230 

7CATTCA7C7 TGGGAAGCAG GTCTAATTGG TAAAGATGAT GAATGGTATA AATTATTCAG 3 3 40 

CAAATC77AC ACGCAAGCAC ATTTGGCTTT ACAG7CTTAT CA77TGAATA CTGCTGCTAA 3 400 

ATC77GGCT7 CAA7C3GGCA ATACAAAGCC TTTATCCGAA TGGATGTCCG ACCAAGGT7A 8 4 6C 

TACACTTATT TCAGGAGTTA ATCCTAGA77 CATT CCAATA CCAAGAGGGT TTGTAAAACA 8 520 

AAA7ACACC7 ATTACTAATG 7CAAA7ACCC GGAAGGCATC AGTTTCGATA CAAACCTAAA 3580 

AAGACA7C7G GCAAA7GCTG ATGG77TTAG TCAAGAACAG GGCATTAAAG GAGCCCATAA 8 6 40 

CCGCACCAA7 T77 ATGGCAG AACTAAATTC ACGAGGAGGA CGCGTAAAAT CTGAAACCCA 8 7 00 

AACTGATATT GAAGGCATTA CCCGAATTAA ATATGAGA7T CCTACACTAG ACAGGACAGG 8760 

TAAACCTGAT GGTGGATTTA AGGAAATTTC AAGTATAAAA ACTGTTTATA ATCCTAAAAA 8820 

ATTTTCTGAT GA7AAAA7AC TTCAAATGGC TCAAAA7GCT GCTTCACAAG GATATTCAAA 8880 

AGCCTCTAAA ATT GCTCAAA ATGAAAGAAC TAAATCAATA TCGGAAAGAA AAAATGTCAT 894 0 

TCAATTCTCA GAAACC777G ACGGAATCAA ATTTAGATCA TATTTTGATG TAAATACAGG 9000 

AAGAATTACA AACA77CACC CAGAATAATT TAAAGGAAAA ATTATGAAAA ATAA7AT777 9060 

7CTAAAC7TA AA7AAAAAA7 CTA7AAATAA CAACCA777T GTTAT7TCGA 7T77TTT7GA 9120 

AACAA77TAC CAATT7GAAA CTAAAGA7AC GCTT7TAGAG TGT7T7AAAA ATATTACAAC 9180 

TACCGGACAT 777GGAGTAA 7AGG7GCTCA ATATGAAAAA ATAGATGCTA CCAGATGGAT 924 0 

7GGAGA77A7 GAAGAGG7AA A7GGATTTGA GTATATTGA7 AAAGCTCCTT CTAT7TATT7 9300 

T7CAGT7GGA GATGAT77CA ATCC7GAAGA ATTAATTATA CCTATTAA77 7AGCATATCA 93 60 

TTACTTTAAT A77GCAATA7 C7GATT7C77 AATAGCTCAC CCTGAATATC AAAAAAAGTG 94 2C 

TAAAGAAATA CAAAAAACAT AT7CTCAAAC AAACTGTAGC CTGCATGAAA CC7AAAATCC 94 80 
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ATCCGTAAGG TGTGTGCTTC AGCACGCACG CGTTCCATGA T7TACGGCTC AATGCC3TCT 9540 

GAAAAGCTCA CAATTTTTCA GACGGCATTT GTTATGCAAG TAAATATTCA GATTCCC7AT 9600 

ATACTGCCCA GACGCGTGCG TGCTGAAGAC ACCCCCTACG C7TGCTGCAG AACT7TCGGG 9 660 

7AAAACC3GT GTGAGCATTA GCGCACCGTA 7GCCAATGAG AACAGTCGCA TCCTGCTCAG 97 20 

CACCACGGAT ATCAGTTCGG AAAACGGCAA AATCAAAATT CAATCTTACG GTGACCAATA 9780 

TTACTATGCG AGACAGAGCG AACTCTATAC C7TTGAACGC GGCAGCTACA AAACTGGCAA 9840 

ATGGTACAAC CSCAAACACA T7ACCGAAGT CAAAGAACAC AAAAACGCCA AGCCCGACGC 9900 

AGT AAA CCTC AGCGCATCCC AAGGCATCGA CA7CAAATCT GG7GGCAGCA TCGACGCCTA 9960 

CGCCACCGCA TTCGATGCCC CCAAAGGCAG CATTAACATC GAAGCCGGGC GGAAATTGAC 10020 

ACTCTA7GCC GTAGAAGAGC TCAACTACGA CAAACTAGAC AGCCAAAAAA GGCGCAGATT 10080 

TCTCGGCATC AGCTACAGCA AAGCACACGA CACCACCACC CAAGTCATGA AAACCGCGCT 1014 0 

GCCCTCAAGG GTAGTTGCAG AATCAGCCAA CCTCCAATCG GGCTGGGATA CCAAACTGCA 10200 

AGGCACACAG 7TTGAAACCA CACTGGGTGG CGCAACCATA CGCGCAGGCG TAGGTGAGCA 10260 

GGCACGGGCA GATGCCAAGA TTATCCTCGA AGGGATCAAA AGCAGCATCC ACACAGAAAC 10320 

CGTGAGCAGC AGCAAATCTA CTCTATGGCA AAAACAGGCA GGACGGGGCA GTAACATCGA 10380 

AACCTTGCAA TTGCCGAGTT TCACCGGTCC CGTTG CGCCC GTACTGTCCG CACCC3GC3G 10 4 40 

TTACATTGTC GACATTCCGA AAGGCAATCT GAAAACCCAA ATOGAAACCC TCACCAAGCA 10500 

GCCCGAGTAT GCT7ATTTGA AACAACTTCA AGTTGCGAAA AACATCAACT GGAATCAGGT 10560 

GCAGCTTGCT TACGATAAAT GGGACTACAA ACAGGAGGGC ATGACACCCG CAGCAGCAGC 10620 

lU T LbiUji ' l A7CGTG3TAA CQGTATTGAC CTAOGGTGCA CTGTCCGCCC CGGCAGCCGC 10680 

C3GAACGGCG GGCGCDGCAG GCGCAGGAGC GGGAGGAGOC GCAGCAGGAA CGGCAGCOGG 10740 

AACTGGAGTA GCAGCAGGAA CGGCAGCCAC AACCGGAGTA GCAGCAGGCA CATCAGCTGC 10800 



BNSOCOD. <WO 98C32S47A2_L» 



FEUILLE DE REMPLACEMENT (REGLE 2© 



WO98/02547 PCT/FR97/01295 

75 

AGC7ATCACC ACAGCCGCAG GCAAAGCCGC ACTGGCCAGT CTCGCCAGCC AAGCCSCAG? 10860 

TTCCCTCATC AACAACAAAG GAGACATAAA CCATACCCTG AAAGAACTGG GCAAAAGCAG 1 09 20 

CACCGTCAGA CAGGCCGCQX CCGCCGCCGT AACC3CAGGC GTACTGCAGw GCATAAGC3G 109 8 0 

GCTGAACACC CAAGCAGCCG AAGCCGTCAG CAAACATTTT CACAGTCCCG CAGCAGGCAA 1104 0. 

ACTGACCGC7 AACC7GATCA ACAGCACCGC TGCCGCAAGT GTCCATACCG CCATCAACGG 11100 

CGGCAGCCTG AAAGACAACT TGGGCGATGC CGCACTGGGT GCGATAGTCA GTACCGTACA 1116 0 

CGGAGAAG7A GCGAGCAAAA TCAAATTTAA TCTCAG CG AA GACTACATTG CCCACAAGAT 11220 

AGCCCATGCC GTAGCAGGCT GTGCATCGGC GGTAGCAAAT AAAGGCAAAT GTCGGGACGG 11280 

CGCAA7CGGC GCGGCAG7C3 GCGAGATGGT GGGAGAAACC CTGTTGGACG GACGCGATGT 11340 

AGGCAAACTG TCACCCCAAG AACGCCAAAA AGTCATAGCC TACTCGCAGA TTATCGCAGG 11400 

CAGCGCAGTG GCATTGGTTA AAGGGGATGT GAATACGGCG GTCAATGCGG CTACTGTGGC 11 4 SO 

AGTGGAGAAT AA7AG7CTTT TAGCTCGCAG GAGGGTAAAT ATACGTTGGA CTCCGCGACA 115 20 

AGAATTGGAA CATGAATATG CCAT7CT7GA AATCCAGGCC ATTACCAATC AAATCCGAAG 11580 

GCTGGATCCG AAATTTAA CG GGATTGCTAT TCTGAGGACT CCTGGAGAGC CGTGGACAAG 116 4 0 

ACATGATGTA CAAACATACA GGCAATATTA TAATCAATTA AGGGAATCCA GAGGCTTTGC 11700 

7GTTGAACCA AT77ATAGAA TCAGGATAAA CAACGGCAAT GAATTTAACC GTATCATGTC 11760 

ATCAAAATAC CCTT ATAA7G AGCTTTATGT AGCCAATCCT AAATCGGCGA CGGGGTATIT 11820 

TAGGGTAGAT TCGTATGATC CTGCGACAAG GG AAATTATT TCAAGAAAAT TTACCCAATT 118 80 

TTCTCAAATC CAAGAAAGTA CGGGGATTGG TTATATCAAG GAGGCTGTTA GAAAATATAG 11940 

CCCTGGTACT GTCATTTCCA ATGTTCCAAG TACACCTACT AGGATAAGAG GAAGAAAGCT 12000 

TGAAGGAAAA CTTATTTTAG AAGTTCCTGC TCAGGTCAAT CCAATTCCAC AATCTGTATT 12060 

AAGGGOGGCA CAAGAAGAAA ATGTTATCAT TAGAGATACA ACAGGAAGGA TTTACAAATG 12120 

AAGAAAGATA TTT7TTATTG TGAGCAGTGG TCTTATGGTT ATAAGAGACT TCATAAGCCT 12180 
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TT7TCTGAGA AACAAGCTGA GG AAA AACAT CTTAAAGGGG AGTTATATAC TGCCGTAATA 1224 0 

GCTTCGGCGA CACAACCTGA ATATGTAATT ACCTTGCGAG AGGAAGTAGG TTTTTTTTCo 12300 

GTAAA7TTTT TCGATAAATT TGGAAGGGAT TA7TTAACCC ATCAAT7TCA AAAATATTCC 12360 

AATTCGAATT ATTATT7TCT T7CTA7GGCT GTATGGAGAG ATTATATAAC TTTGGAATCT 12 420 

CATGACTTAG CAGAAGGATA TACT7ATTTC TTCAATGAAA ATACGGATGA TTGCTATGTT 124 80 

TTGAAACAAG ATTTTATTAA TAATGAGCGA TATGAAAAAA CAGAATTA7A TTCCCAAAAA 12540 

GATAAGGTAA 77C7AT7TCC AAAGTTTGGT GAATATGATT TGGTGTTAAA TCCGGACA7T 12600 

ATTTAATTAA GT77TAAGGC CS7C7GAAAA AAATTTCAAA CGGCTTTTA7 TATTGGGT7T 12660 

GGAATCTGAG GATAAAGCTG ATAAAAACCA GGAAATTATC AGATTGC7AT ATACGTATTS 12720 

TTGTACAGAC TAAAGGCAGC AATCAAATCA CTA T T GCTTA CCCACAAAAA TAAATTGATT 12780 

ATATGGAATA ATCATGAATA AGAGAATGAA AATGTGTCCT GCTTGTCAAC AAGGCTATCT 12840 

CTACCATTCG AAACCTAAAT ATCTTCATGA TGAAATTATT C TGTGTC ATG AATGCGATGC 12900 

AGTATGGCTC AAAGGTATGA ATATATTTTA TGGAGAATAT GAAAAAGATT TTTATTCTTA 12960 

TGTTCCT7TC ATGGAATCCC AAGGTATAAC GAGTCAATGT ATTTGGGAAG GAGATTTGTT 13020 

TGATCATCCA TATTATGAAG ATGAAAACTC AAATGATATC GA7TGATGGA AATTTTAAGC 13080 

CTGCG7AGGT A CG ATT AG CC ATCAAACGGC GTAATCATAC GCAAGATTAT CAACAGAGAG 13140 

GGCTGGCAGC GATATACCAC CCACAAGATT GCCCATGCCA TAGCGGGCTG TGOGGCAGOG 13200 

GCGGCGAATA AGGGCAAGTG TCAGGATGGT GCGATAGGCG CTGCAGTCGG TGAGA TTGTT 13260 

GGTGAGGCTT TGGTTAAGAA TACTGATTTC AGTCGTATGA GTGCGACOGA AATCGAAAAA 13320 

GCTAAAGGGA AGATTACTGC CTATTCAAAA CT GGT7GCCG GCACT G CG TC TGCCGTTGTA 13380 

GGCGGGGATG TGAATACAGC GGG5AATG0G GCACAGATAG CGGTGGAGAA TAATAC7TTG 134 40 

TATCCTAGAT GCG7TGGTCC AAAGTGTGAT GAATTTCAAA AGGAACAACA AAAATCGATA 13500 
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CGTGAAAATC CTCAAGAATA TCGAGAAGTT TTGCTTT77C AGACAGGATT TATTCCAATT 135 60 

ATC3GTGATA TACAGAGT7T TGTACAAGCA CAGACCGCTG CCGATCACCT GTTrGCTrTG 13620 

CTGGGTGTGG TTCCGGGTAT CGGTGAATCG A7ACAGGCCT ATAAAGTAGC GAAAGCGGCA 13680 

AAAAATTTAC AAGGCVTGAA AAAAGCCTTG GACAAGGCAG CAACCGTTGC CACTGCACAG 137 JO. 

GGCTATGTCA GCAAAACCAA AATCAAAATC GGTCAAACTG AATTAAGGGT TACTGCAGCA 13800 

ACTGACAAAC AATTGCTGAA AGCTATTGGC GAAGGAAGGG ACACGACAGG TAAAATGACC 138 60 

GAGCAGTTAT TTGACTCTT7 AGCTAAACAA AATGGCTTCA GAGTGCTTTC GGGCGGCAAA 139 20 

TACGGCGGAA ATAACGGTTT TGATCATGTA TGGCAGGCTG CCGATGGTAG TGTCGTTTT3 13980 

ATTGTAGAAA GTAAGCAGAT TAGGAACGGT ACGGTACAGC TGAATCCGAA TGGTGCGGGT 1404 0 

CGATATACCC AAATGAGTGA GGATTGGATT AGACAAGTT7 TAGATCAATT ACCCGATGGT 14100 

AGTCCEGCTA AAGC7GCTGT CTTCAAAGCA AATAAGAACG GCACATTAAA AACAGCAATA 14160 

GCAGGCGTTG ATCGTCAAAC AGGTAAGGCC GTTATTCTTC CTGTCAAAGT TCCTTCTAAA 14220 

ACCAATATAA GGAGATAACA ATGGGGCACA ATATGATGAC CACCCAAAAA TGGTATGAGC 14280 

ATATTACTAA TGTAATCA7A GGCAATACTG CTAATTTCAA TAGCGGTTGC CTTGACTCTA 14 340 

TAGAT7ATGT AGATGAAAGA AAAGGCGTTC C3CTTGCAGC TATGCAACAT ATTTTCATGG 14 400 

ACGTTAGAGC TGCAGCTTCC CATGCCTATC TATTTGAACA TGATCTTAAG AAATTCAAGC 14460 

AATATGCTTA TGTTGCAGGA AAGCTGGGGG 7T7TGCTGAG TGTAAATTCT ACAGACCCTG 14 520 

AACCCTTCTT CTTTCCC7GT GACATGCTCA ACATTCAAAA TCCGATGTTT CTGATGCTGA 14580 
TGAGCGACAG CCCACAGC7G CGTGAGTTTC TGGTGCGCAA TATCGACAAC ATC3CCAACG 14 640 
ATACAGAAGC CTTTATAAAC CGCTACGACC TCAACCGGCA TATGATTTAC AATACTCTGC 14 700 
TGATGGTGGA GGGTAAGCAG CTTGATCGGT TGAAACAACG TAGCGAGAAA GTCTTGGCGC 14760 
ATCCCACCCC TAGCAAATGG CTGCAAAAGC GGTTGTACGA TTACCGCTTC TTCCTCGCTT 14 820 
TCGCCGAACA GGATGCCGAG GCAATGAAAG CCGCCTTAGA GCCGCTTTTC GATAAAAAAA 14 880 
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CCGCGCGTAT GC-C7GCCAAA GAAACAT7G7 CCTATTTCGA TTTCTACCTG CAGCCGCAAA 14 940 

7CGTTACCTA CGCCAAAA7C GCATCCATGC ACGG7TTCGA TTTGGGCATA GATCAAGAAA 15000 

7CTCACCGAG GGATTTGATT G7T7ACGA7C CGCTGCCGGC AGACGAATAT CAAGACA7CT 15060 

TCGAT7T7AT GAAACAGTAT GACTTGTCTT ACCCGTATGA ATATCTGCAG GATTGGATAG 15120 

ATTACTATAC GTTCAAAACC GATAAGCTGG TATTTGGTAA CGCGAAGCGA GAGTGAGCCG 15180 

TAAAACTCTG AGCTCCTGTT TTATAGATTA CAACTTTAGG CCGTCTTAAA GCTGAAAGAT 15240 

TTTCGAAAGC TATAAATTGA AGCCCTTCCA CAGTACATAG ATCTGTGTTG TGGCGGGGCT 15300 

7TACCACGCT GATTGCCGGA GAAGAACTCA ACCTGCTGGC AAAACAAGGC ATGAGATCTT 15360 

73CAATAACA TGAGTT GAGA CCTTTGCAAA AAAGCCCTTC CCCGACATCC GAAACCCAAA 15420 

CACAGGATTT C5G CTGTTTT CGTACCAAAT ACCTCCTAAT TTTACCCAAA TACCCCOTA 15480 

ATCCTCCTCG GACACCOGAT AATCAGGCAT CCGGGCTGCC TTTTAGGOGG CAGCGGGOGC 15540 

ATTTAGCCTG T7GGCCGCTT TCAACAGGTT CAAACACATC GCCTTCAGGT GGCTTTGOGC 15600 

ACTCACTTTG TCATTTCCAA 15620 

(2) INFORMATIONS POUR LA SEQ ID NO: 37: 

( l ) GtfACTERISTIQUES DE LA SEQUENCE : 
(A) LONGUEUR: 580 acides amines 
(3) TYPE: acide amine 

(C) NOMBRE DE BR INS : simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: peptide 

(ix) CARACTERISTIQUE : 

(A) NOM/CLE : Protein 

(B) EMPLACEMENT: 1. .580 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 37: 

Met Lys Phe Phe Pro Ala Pro Cys Leu Leu Val lie Leu Ala Val lie 
15 10 15 
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Pro Leu Lys Thr Leu Ala Ala Asp Glu Asn Asp Ala Clu Leu He Arc 



25 



30 



Ser Mec Gin Arg Gin Gin His He Asp Ala Clu Leu Leu Thr Asp Ale 
35 40 ^ 

Asn Val Arg Phe Glu Gin Pro Leu Glu Lys Asn Asn Tyr Val Leu Ser 
50 55 SO 

Glu Asp Glu Thr Pro Cys Thr Arg Val Asn Tyr He Ser Leu Asp Asp 



65 



70 



75 



30 



Lys Thr Aia Arg Lys Phe Ser Phe Leu Pro Ser Val Leu Met Lys Glu 
85 50 S5 

Thr Ala Phe Lys Thr Gly Met Cys Leu Gly Ser Asn Asn Leu Ser Arc 
100 105 no 

Leu Gin Lys Ala Ala Gin Gin He Leu He Val Arg Gly Tyr Leu Thr 
1X5 120 125 

Ser Gin Ala lie He Gin Pro Gin Asn Met Asp Ser Gly lie Leu Lys 
130 135 140 

Leu Arg Val Ser Ala Gly Glu He Gly Asp He Arg Tyr Glu Glu Lys 
145 150 155 HO 

Arg Asp Gly Lys Ser Ala Glu Gly Ser lie Ser Ala Phe Asn Asn Lys 
165 170 i75 

Phe Pro Lau Tyr Arg Asn Lys He Leu Asn Leu Arg Asp Val Glu Gin 
180 185 19° 

Gly Leu Glu Asn Leu Arg Arg Leu Pro Ser Val Lys Thr Asp He Gin 



195 



200 



205 



lie lie Pro Ser Glu Glu Glu Gly Lys Ser Asp Leu Gin He Lys Trp 
210 215 220 

Gin Gin Asn Lys Pro lie Arg Phe Ser lie Gly He Asp Asp Ala Gly 

235 240 



225 



230 



Gly Lys Thr Thr Gly Lys Tyr Gin Gly Asn Val Ala Leu Ser Phe Asp 
245 250 255 
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Asn Pro Lau Giy Lau Ser Asp Lau Phe Tyr Val Sar Tyr Giy Arg Gly 
260 265 270 

Leu Val His Lys Thr Asp Lau Thr Asp Ala Thr Gly Thr Glu Thr Glu 
275 230 285 

Ser Giy Sar Arg Sar Tyr Ser Val His Tyr Ser Val Pro Val Lys Lys 
290 295 300 

Trp Leu Phe Sar Phe Asn His Asn Gly His Arg Tyr His Glu Ala Thr 
305 310 315 320 

Glu Gly Tyr Ser Val Asn Tyr Asp Tyr Asn Gly Lys Gin Tyr Gin Ser 
325 330 335 

Ser Leu Ala Ala Glu Arg Met Leu Trp Arg Asn Arg Phe His Lys Thr 
340 345 350 

Ser Val Giy Met Lys Leu Trp Thr Arg Gin Thr Tyr Lys Tyr He Asp 
355 360 365 

Asp Ala Glu He Glu Val Gin Arg Arg Arg Ser Ala Gly Trp Glu Ala 
370 375 380 

Glu Leu Arg His Arg Ala Tyr Leu Asn Arg Trp Gin Leu Asp Gly Lys 
385 390 395 400 

Leu Ser Tyr Lys Arg Gly Thr Gly Met Arg Gin Ser Met Pro Ala Pro 
405 410 415 

Glu Glu Asn Gly Gly Gly Thr He Pro Gly Thr Ser Arg Met Lys He 
420 425 430 

lie Thr Ala Gly Leu Asp Ala Ala Ala Pro Phe Met Leu Gly Lys Gin 
435 440 445 

Gin Phe Phe Tyr Ala Thr Ala He Gin Ala Gin Trp Asn Lys Thr Pro 
450 455 460 

Leu Val Ala Gin Asp Lys Leu Ser He Gly Ser Arg Tyr Thr Val Arg 
465 470 475 480 



Gly Phe Asp Giy Glu Gin Ser Leu Phe Gly Glu Arg Giy Phe Tyr Trp 
485 490 495 
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Gin Asn Thr Leu Thr Trp Tyr Phe His Pro Asn His Gin Phe Tyr Leu 
500 505 510 

Giy Ala Asp Tyr Gly Arg Val Ser Gly Giu Ser Gin Tyr Val Ser 
515 520 525 

Giy Lys Gin Leu Met Giy Ala Vai Val Gly Phe Arg Giy Gly His Lys 
530 535 540 

Val Gly Gly Met Phe Ala Tyr Asp Leu Phe Ala Gly Lys Pro Leu His 
545 550 555 560 

Lys Pro Lys Giy Phe Gin Thr Thr Asn Thr Val Tyr Gly Phe Asn Leu 
565 570 575 

Asn Tyr Ser Phe 
58C 

(2) INFORMATIONS PCUR LA SZQ ID NO: 38: 

( l ) CARACTERISTIQUES DE LA SEQUENCE : 
(A) LONGUEUR: 1981 acides amines 
(3) TYPE: acide amine 

(C) NCMBRE DE 3RINS . simple 

(D) CONFIGURATION: lineaire 

in} TYPE DE MOLECULE : peptide 



(ix) CARACTERISTIQUE: 

(A) NCK/CLE: Peptide 

(B) EMPLACEMENT: 1 . . 1981 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 38: 

Met Asn Lys Gly Leu His Arg He lie Phe Ser Lys Lys His Ser Thr 
15 10 15 

Met Val Ala Val Ala Glu Thr Ala Asn Ser Gin Gly Lys Gly Lys Gin 
20 25 30 

Ala Gly Ser Ser Val Ser Vai Ser Leu Lys Thr Ser Giy Asp Leu Cys 
35 40 45 
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Gly Lys Leu Lys Thr Thr Leu Lys Thr Leu v a i Cys Ser Leu Val Ser 
50 55 60 

Leu Ser Met Val Leu Pro Ala His Ala Gin He Thr Thr Asp Lys Ser 
65 70 75 80 

Ala Pro Lys Asn Gin Gin Val Val He Leu Lys Thr Asn Thr Gly Ala 
85 90 95 

Pro Leu Val Asn He Gin Thr Pro Asn Gly Arg Gly Leu Ser His Asn 
100 105 110 

Arg Tyr Thr Gin Phe Asp Val Asp Asn Lys Gly Ala Val Leu Asn Asn 
115 120 125 

Asp Arg Asn Asn Asn Pro Phe Leu Val Lys Gly Ser Ala Gin Leu lie 
130 135 140 

Leu Asn Giu Val Arg Gly Thr Ala Ser Lys Leu Asn Gly He Vai Thr 
145 150 155 160 

Val Gly Gly Gin Lys Ala Asp Val He He Ala Asn Pro Asn Gly lie 
165 170 175 

Thr Val Asn Gly Gly Gly Phe Lys Asn Val Gly Arg Gly He Leu Thr 
180 185 190 

He Gly Ala Pro Gin He Gly Lys Asp Gly Ala Leu Thr Gly Phe Asp 
195 200 205 

Val Arg Gin Gly Thr Leu Thr Val Gly Ala Ala Gly Trp Asn Asp Lys 
210 215 220 

Gly Gly Ala Asp Tyr Thr Gly Vai Leu Ala Arg Ala Val Ala Leu Gin 
225 230 235 240 

Gly Lys Leu Gin Gly Lys Asn Leu Ala Vai Ser Thr Gly Pro Gin Lys 
245 250 255 

val Asp Tyr Ala Ser Gly Glu lie Ser Aia Gly Thr Ala Ala Gly Thr 
260 265 270 

Lys Pro Thr He Ala Leu Asp Thr Ala Aia Leu Gly Gly Met Tyr Ala 
275 280 285 
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Asp Ser II© Thr Leu lie Ala Asn Glu Lys Gly Val Gly Vai Lys Asn 

290 295 300 

Ala Gly Thr Leu Glu Ala Ala Lys Gin Leu He Val Thr Ser Sar Gly 
305 310 315 320 

Arg lie Glu Asn Ser Gly Arg He Ala Thr Thr Ala Asp Gly Thr Glu 
325 330 335 

Ala Ser Pro Thr Tyr Leu Ser He Glu Thr Thr Glu Lys Gly Ala Ala 
340 345 350 

Gly Thr Phe He Ser Asn Gly Gly Arg He Glu Ser Lys Gly Leu Leu 
355 360 365 

Val He Glu Thr Gly Glu As? He Ser Leu Arg Asn Gly Ala Val Val 
370 375 380 

Gin Asn Asn Gly Ser Arg Pro Ala Thr Thr Val Leu Asn Ala Gly His 
385 390 395 " 400 

Asn Leu Val lie Glu Ser Lys Thr Asn Val Asn Asn Ala Lys Gly Ser 
405 410 415 

Ala Asn Leu Ser Ala Gly Gly Arg Thr Thr He Asn Asp Ala Thr He 
420 425 430 

Gin Ala Gly Ser Ser Val Tyr Ser Ser Thr Lys Gly Asp Thr Glu Leu 
435 440 445 

Gly Glu Asn Thr Arg He He Ala Glu Asn Val Thr Val Leu Ser Asn 
450 455 460 

Gly Ser He Gly Ser Ala Ala Vai He Glu Ala Lys Asp Thr Ala His 
465 470 475 480 

He Glu Ser Gly Lys Pro Leu Ser Leu Glu Thr Ser Thr Val Ala Ser 
485 490 495 

Asn He Arg Leu Asn Asn Gly Asn He Lys Gly Gly Lys Gin Leu Ala 
500 505 510 



Leu Leu Ala Asp Asp Asn He Thr Ala Lys Thr Thr Asn Leu Asn Thr 
515 520 525 
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Pro Gly Asn Leu Tyr Val His Thr Gly Lys Asp Leu Asn Lou Asn Val 
530 535 540 

Asp Lys Asp Leu Ser Ala Ala Ser He His Leu Lys Ser Asp Asn Ala 
545 550 555 560 

Ala His He Thr Gly Thr Ser Lys Thr Leu Thr Ala Ser Lys Asp Met 
565 570 575 

Gly Vai Glu Ala Gly Leu Leu Asn Val Thr Asn Thr Asn Leu Arg Thr 
580 585 590 

Asn Ser Gly Asn Leu His He Gin Ala Ala Lys Gly Asn lie Gin Leu 
595 600 605 

Arg Asn Thr Lys Leu Asn Ala Ala Lys Ala Leu Glu Thr Thr Ala Leu 
610 615 620 

Gin Gly Asn lie Val Ser Asp Gly Leu His Ala Val Ser Ala Asp Gly 
625 630 635 640 

His Val Ser Leu Leu Ala Asn Gly Asn Ala Asp Phe Thr Gly His Asn 
645 650 655 

Thr Leu Thr Ala Lys Ala Asp Val Asn Ala Gly Ser Val Gly Lys Gly 
660 665 670 

Arg Leu Lys Ala Asp Asn Thr Asn lie Thr Ser Ser Ser Gly Asp He 
675 680 685 

Thr Leu Val Ala Gly Asn Gly He Gin Leu Gly Asp Gly Lys Gin Arg 
690 695 700 

Asn Ser lie Asn Gly Lys His He Ser He Lys Asn Asn Gly Gly Asn 
705 710 715 720 

Ala Asp Leu Lys Asn Leu Asn Val His Ala Lys Ser Gly Ala Leu Asn 
725 730 735 

He His Ser Asp Arg Ala Leu Ser He Glu Asn Thr Lys Leu Glu Ser 
740 745 750 



Thr His Asn Thr His Leu Asn Ala Gin His Glu Arg val Thr Leu Asn 
755 760 765 
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Gin Val Asp Ala Tyr Ala His Arg His Leu Ser lie Thr Gly Ser Gin 
770 775 780 

He Trp Gin Asn Asp Lys Leu Pro Ser Ala Asn Lys Leu val Ala Asn 
785 790 795 800 

Gly Val Leu Ala Leu Asn Ala Arg Tyr Ser Gin He Ala Asp Asn Thr 
805 810 815 

Thr Leu Arg Ala Gly Ala He Asn Leu Thr Ala Gly Thr Ala Leu Val 
820 825 830 

Lys Arg Gly Asn He Asn Trp Ser Thr Val Ser Thr Lys Thr Leu Glu 
835 840 845 

Asp Asn Ala Glu Leu Lys Pro Leu Ala Gly Arg Leu Asn He Glu Ala 
850 855 860 

Gly Ser Gly Thr Leu Thr He Glu Pro Ala Asn Arg He Ser Ala His 
865 870 875 880 

Thr Asp Leu Ser lie Lys Thr Gly Gly Lys Leu Leu Leu Ser Ala Lys 
885 890 895 

Gly Gly Asn Ala Gly Aia Pro Ser Ala Gin Val Ser Ser Leu Glu Ala 
900 905 910 

Lys Gly Asn He Arg Leu Val Thr Gly Glu Thr Asp Leu Arg Gly Ser 
915 920 925 

Lys He Thr Ala Gly Lys Asn Leu Val Val Ala Thr Thr Lys Gly Lys 
930 935 940 

Leu Asn He Glu Ala Val Asn Asn Ser Phe Ser Asn Tyr Phe Pro Thr 
945 950 955 960 

Gin Lys Ala Ala Glu Leu Asn Gin Lys Ser Lys Glu Leu Glu Gin Gin 
965 970 975 

He Ala Gin Leu Lys Lys Ser Ser Pro Lys Ser Lys Leu He Pro Thr 
980 985 990 

Leu Gin Glu Glu Arg Asp Arg Leu Aia Phe Tyr lie Gin Ala He Asn 
995 1000 1005 
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Lys Glu val Lys Gly Lys Lys Pro Lys Gly Lys Glu Tyr Leu Gin Ala 
1010 1015 1020 

Lys Leu Ser Aia Gin Asn He Asp Leu He Ser Ala Gin Gly He Glu 
1025 1030 1035 1040 

He Ser Gly Ser Asp lie Thr Ala Ser Lys Lys Leu Asn Leu His Aia 
1045 1050 1055 

Ala Gly val Leu Pro Lys Ala Ala Asp Ser Glu Ala Aia Ala He Leu 
1060 1065 1070 

lie As? Gly lie Thr Asp Gin Tyr Glu He Gly Lys Pro Thr Tyr Lys 
1075 1080 i085 

Ser His Tyr Asp Lys Ala Aia Leu Asn Lys Pro Ser Arg Leu Thr Gly 
1090 1095 1100 

Arg Thr Gly Val Ser lie His Ala Ala Ala Ala Leu Asp Asp Ala Arg 
1105 1110 1115 1120 

He lie lie Gly Ala Ser Glu He Lys Aia Pro Ser Gly Ser lie Asp 
1125 1130 1135 

He Lys Aia His Ser Asp lie Val Leu Glu Ala Gly Gin Asn Asp Aia 
1140 1145 1150 

Tyr Thr Phe Leu Lys Thr Lys Gly Lys Ser Gly Lys He lie Arg Lys 
1155 1160 1165 

Thr Lys Phe Thr Ser Thr Arg Asp His Leu lie Met Pro Ala Pro v a l 
1170 1175 1180 

Glu Leu Thr Ala Asn Gly lie Thr Leu Gin Ala Gly Gly Asn He Glu 
1185 1190 1195 1200 

Ala Asn Thr Thr Arg Phe Asn Aia Pro Ala Gly Lys val Thr Leu Val 
1205 1210 1215 

Ala Gly Glu Glu Leu Gin Leu Leu Aia Glu Glu Gly He His Lys His 
1220 1225 1230 

Glu Leu Asp Val Gin Lys Ser Arg Arg Phe lie Gly He Lys Val Gly 
1235 1240 1245 
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Lys Ser Asn Tyr Ser Lys Asn Glu Leu Asn Glu Thr Lys Leu Pro Val 
1250 1255 1^60 

Arc Val Val Ala Gin Thr Ala Ala Thr Arg Ser Giy Tr? Asp Thr vel 
1265 1270 i=75 12S0 

Leu Glu Gly Thr Glu Phe Lys Thr Thr Leu Ala Gly Ma Asp lie Gin 
1285 1290 1295 



Ala Gly Val Gly Glu Lys Ala Arg val Asp Ala Lys He lie Leu Lys 
130C 1305 1310 

Gly He Val Asn Arg He Gin Ser Glu Glu Lys Leu Glu Thr Asn Ser 



1315 



1320 



1325 



Thr val Trp Gin Lys Gin Ala Gly Arg Gly Ser Thr lie Glu Thr Leu 
1330 1335 1340 

Lys Leu Pro Ser Phe Glu Ser Pro Thr Pro Pro Lys Leu Ser Ala Pro 
1345 1350 1355 1360 

Gly Giy Tyr lie Val Asp lie Pro Lys Gly Asn Leu Lys Thr Glu lie 
1365 1370 1375 

Giu Lys Leu Ser Lys Gin Pro Glu Tyr Ala Tyr Leu Lys Gin Leu Gin 
138C 1385 i390 



Val Ala Lys Asn He Asn Trp Asn Gin Val Gin Leu Ala Tyr Asp Arg 
1395 1400 1405 

Trp Asp Tyr Lys Gin Giu Gly Leu Thr Glu Ala Giy Ala Ala He lie 
1410 1415 H 20 

Ala Leu Ala Val Thr Val Vai Thr Ser Gly Ala Gly Thr Gly Ala Val 
1425 1430 1435 1440 

Leu Gly Leu Asn Gly Ala Ala Ala Ala Ala Thr Asp Ala Ala Phe Ala 
1445 1450 1455 

Ser Leu Ala Ser Gin Ala Ser Val Ser Phe lie Asn Asn Lys Gly Asp 
1460 1465 1470 

Val Gly Lys Thr Leu Lys Glu Leu Gly Arg Ser Ser Thr Val Lys Asn 
1475 1480 1485 
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Leu val vai Ala Ala Ala Thr Ala Gly Val Ala Asp Lys Ilo Gly Ala 

1490 1495 1500 

Ser Ala Leu Asn Asn Val Ser Asp Lys Gin Trp He Asn Asn Leu Thr 
1505 1510 1515 1520 

Vai Asn Leu Ala Asn Ala Gly Ser Ala Ala Leu He Asn Thr Ala Vai 
1525 1530 1535 

Asn Gly Gly Ser Leu Lys Asp Asn Leu Glu Ala Asn He Leu Ala Ala 
1540 1545 1550 

Leu Val Asn Thr Ala His Gly Glu Ala Ala Ser Lys lie Lys Gin Leu 
1555 1560 1565 

Asp GIr. His Tyr lie Val Kis Lys lie Ala His Ala He Ala Gly Cys 
1570 1575 1580 

Ala Ala Ala Ala Ala Asn Lys Gly Lys Cys Gin Asp Gly Ala lie Gly 
1585 1590 1595 1600 

Ala Ala Val Gly Glu He Val Gly Glu Ala Leu Thr Asn Gly Lys Asn 
1605 1610 1615 

Pro Asp Thr Leu Thr Ala Lys Glu Arg Glu Gin He Leu Ala Tyr Ser 
1620 1625 1630 

Lys Leu Val Ala Gly Thr Val Ser Gly Val Val Gly Gly Asp Val Asn 
1635 1640 1645 

Ala Ala Ala Asn Ala Ala Glu Val Ala Val Lys Asn Asn Gin Leu Ser 
1650 1655 1660 

Asp Lys Glu Gly Arg Glu Phe Asp Asn Glu MBt Thr Ala Cys Ala Lys 
1665 1670 1675 1680 

Gin Asn Asn Pro Gin Leu Cys Arg Lys Asn Thr Val Lys Lys Tyr Gin 
1685 1690 1695 

Asn Val Ala Asp Lys Arg Leu Ala Ala Ser He Ala lie Cys Thr Asp 
1700 1705 1710 

He Ser Arg Ser Thr Glu Cys Arg Thr lie Arg Lys Gin His Leu He 
1715 1720 1725 
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Asp Ser Arg Sar Leu His Ser Ser Trp Glu Ala Gly Leu lie Gly Lys 
1730 1735 1 7 <C 

Asp asd Glu Trp Tyr Lvs Leu Phe Ser Lys Ser Tyr Thr Gin Ala Asp 
1745 1750 1755 1760 

Leu Ala Leu Gin Ser Tyr His Leu Asn Thr Ala Ala Lys Ser Tr? Leu 
1765 1770 1775 

Gin Ser Gly Asn Thr Lys Pro Leu Ser Glu Trp Met Ser Asp Gin Gly 
1780 1785 1730 

Tyr Thr Leu lie Ser Gly val Asn Pro Arg Phe lie Pro lie Pro Arg 
17? 5 1800 1805 

Gly Phe val Lys Gin Asn Thr Pro lie Thr Asn Val Lys Tyr Pro Glu 
1810 1815 1820 

Gly He Ser Phe Asp Thr Asn Leu Lys Arg His Leu Ala Asn Ala Asp 
1825 1830 1835 1840 

Gly Phe Ser Gin Glu Gin Gly He Lys Gly Ala His Asn Arg Thr Asn 
18 45 1850 1855 

Phe Met Ala Glu Leu Asn Ser Arg Gly Gly Arg Val Lys Ser Glu Thr 
I860 1865 1870 

Gin Thr Asp lie Glu Gly He Thr Arg He Lys Tyr Glu He Pro Thr 
1875 1880 1885 

Leu Asp Arg Thr Gly Lys Pro Asp Gly Gly Phe Lys Glu lie Ser Ser 
1890 1895 1900 

lie Lvs Thr Val Tyr Asn Pro Lys Lys Phe Ser Asp Asp Lys He Leu 
1905 ' 1910 "IS 1320 

Gin Met Ala Gin Asn Ala Ala Ser Gla Gly Tyr Ser Lys Ala Ser Lys 
1925 1930 1935 

He Ala Gin Asn Glu Arg Thr Lys Ser lie Ser Glu Arg Lys Asn Val 
1940 1945 1950 

He Gin Phe Ser Glu Thr Phe Asp Gly He Lys Phe Arg Ser Tyr Phe 
1955 I960 1965 
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Asp Val Asn Thr Gly Arg lie Thr Asn lie His Pro Glu 
1970 1975 1980 

C) INFORMATIONS POUR LA SEQ ID NO: 39: 

(i) CARACTER I ST2 CUES DE LA SEQUENCE : 
(A) LONGUEUR: 143 acides amines 
(3) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : Hneaire 

(11) TYPE DE MOLECULE : peptide 



(IX) CARACTZRISTICUE: 

(A) NOM/CLE: Peptide 
(3) EMPLACEMENT : 1 . .143 



(:<i) DESCRIPTION DE LA SEQUENCE: SEC ID NO: 39: 

Met Lys Asn Asn lie Phe Leu Asn Leu Asn Lys Lys Ser lie Asn Asn 
15 10 15 

Asn His Phe Val He Ser He Phe Phe Glu Thr He Tyr Gin Phe Glu 
20 25 30 

Thr Lys Asp Thr Leu Leu Glu Cys Phe Lys Asn He Thr Thr Thr Gly 
35 40 45 

His Phe Gly Val He Gly Ala Gin Tyr Glu Lys He Asp Ala Thr Arg 
50 55 60 

Trp lie Gly Asp Tyr Glu Glu Val Asn Gly Phe Glu Tyr lie Asp Lys 
65 70 75 80 

Ala Pro Ser He Tyr Phe Ser Val Gly Asp Asp Phe Asn Pro Glu Glu 
85 90 95 

Leu lie He Pro He Asn Leu Ala Tyr His Tyr Phe Asn He Ala He 
100 105 110 

Ser Asp Phe Leu He Ala His Pro Glu Tyr Gin Lys Lys Cys Lys Glu 
115 120 125 
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lie Gin Lys Thr Tyr Ser Gin Thr Asn Cys Ser Leu His Glu Th: 
130 ' "5 HO 

(2) INFORMATIONS PGUP. LA SEQ ID NO 40: 

(i) CARACTERISTICUES DE LA SEQUENCE. 

(A) LONGUEUR: 833 acides amines 

(B) TYPE, acide amine 

(C) NOMBRE DE BRINS : simple 
(0) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 



(ix) CARAC7ERISTI0UE: 

(A) NOM/CLE: Peptide 
(3) EMPLACEMENT : 1 . 833 



(XI) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 40: 

Val Leu Lys Thr Pro Pro Thr Leu Ala Ala Glu Leu Ser Gly Lys Thr 
15 10 15 

Gly val Ser He Ser Ala Pro Tyr Ala Asn Glu Asn Ser Arg lie Leu 
20 25 30 

Leu Ser Thr Thr Asp lie Ser Ser Glu Asn Gly Lys He Lys He Gin 
35 40 "5 

Ser Tyr Gly Asp Gin Tyr Tyr Tyr Ala Arg Gin Ser Glu Leu Tyr Thr 
50 55 «0 

Phe Glu Arg Arg Ser Tyr Lys Thr Gly Lys Trp Tyr Asn Arg Lys His 
65 70 ™ 80 

He Thr Glu val Lys Glu His Lys Asn Ala Lys Pro Asp Ala Val Asn 
85 90 « 

Leu Ser Ala Ser Gin Gly lie Asp He Lys Ser Gly Gly Ser He Asp 
100 105 uo 

Ala Tyr Ala Thr Ala Phe Asp Ala Pro Lys Gly Ser He Asn He Glu 
115 120 I 25 
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Ala Giy Arg Lys Leu Thr Leu Tyr Aia Val ciu Glu Leu Asn Tyr Asp 
130 135 140 

Lys Leu Asp Ser Gin Lys Arg Arg Arg Phe Leu Gly lie Ser Tyr Ser 
US 150 155 UO 

Lys Ala His Asp Thr Thr Thr Gin Val Met Lys Thr Ala Leu Pro Ser 
165 170 175 

Arg val Val Ala Glu Ser Ala Asn Leu Gin Ser Gly Trp Asp Thr Lys 
180 185 190 

Leu Gin Gly Thr Gin Phe Glu Thr Thr Leu Gly Gly Ala Thr lie Arg 
195 200 205 

Ala Giy val Gly Glu Gin Ala Arg Aia Asp Ala Lys He lie Leu Glu 
210 215 220 

Gly lie Lys Ser Ser He His Thr Glu Thr Val Ser Ser Ser Lys Ser 
225 230 235 240 

Thr Leu Trp Gin Lys Gin Ala Gly Arg Gly Ser Asn He Glu Thr Leu 
245 250 255 

Gin Leu Pro Ser Phe Thr Gly Pro Val Ala Pro Val Leu Ser Aia Pro 
260 265 270 

Gly Gly Tyr He Val Asp He Pro Lys Gly Asn Leu Lys Thr Gin He 

275 280 285 

Glu Thr Leu Thr Lys Gin Pro Glu Tyr Ala Tyr Leu Lys Gin Leu Gin 
290 295 300 

Val Aia Lys Asn lie Asn Trp Asn Gin Val Gin Leu Aia Tyr Asp Lys 
305 310 315 320 

Trp Asp Tyr Lys Gin Glu Gly Met Thr Pro Ala Aia Ala Ala Val Val 
325 330 335 

Vai He Val Val Thr Val Leu Thr Tyr Gly Ala Leu Ser Ala Pro Ala 
340 345 350 

Ala Ala Gly Thr Ala Gly Ala Ala Gly Ala Giy Ala Gly Gly Ala Ala 
355 360 365 
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Ala Gly Thr Ala Ala Gly Thr Gly 
370 375 

Thr Gly Val Ala Ala Gly Thr Ser 
365 390 

Gly Lys Ala Aia Leu Ala Ser Leu 
405 



93 

Val Ala Ala Gly Thr Ala Ala Thr 
380 

Ala Ala Ala lie Thr Thr Ala Ala 
395 400 

Ala Ser Gin Ala Ala Val Ser Leu 
410 415 



He Asn Asn Lys Gly Asp lie Asn 
420 

Ser Ser Thr Val Arc Gin Ala Ala 

435 440 

Leu Gin Gly He Ser Gly Leu Asn 
450 455 

Lys His ?he His Ser Pro Ala Ala 
465 470 

Asn Ser Thr Ala Ala Ala Ser Val 
485 

Leu Lys Asp Asn Leu Gly Asp Ala 
500 



His Thr Leu Lys Glu Leu Gly Lys 
425 430 

Thr Ala Ala Val Thr Ala Gly Val 
445 

Thr Gin Aia Ala Glu Aia val Ser 
460 

Gly Lys Leu Thr Ala Asn Leu He 
475 480 

His Thr Aia He Asn Gly Gly Ser 
490 495 

Ala Leu Gly Aia He Val Ser Thr 
505 510 



Val His Gly Glu Val Ala Ser Lys He Lys Phe Asn Leu Ser Glu Asp 

515 520 525 

Tyr He Aia His Lys lie Ala His Ala Val Ala Gly Cys Ala Ser Ala 

530 535 540 



val Ala Asn Lys Gly Lys Cys Arg 
545 550 

Gly Glu Met Val Gly Glu Thr Leu 
565 

Leu Ser Pro Gin Glu Arg Gin Lys 
580 

Ala Gly Ser Ala Val Ala Leu Val 
595 600 



Asp Gly Ala He Gly Ala Ala val 
555 560 

Leu Asp Gly Arg Asp Val Gly Lys 
570 575 

Val lie Ala Tyr Ser Gin lie lie 
585 590 

Lys Gly Asp Val Asn Thr Ala Val 
605 
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Asn Ala Ala Thr Val Ala v a l Glu Asn Asn Ser Leu Leu Ala Arg Arg 
6io 6i5 *:o 

Arg val Asn lie Arg Tr? Thr Pro Arg Gin Glu Leu Glu His Glu Tyr 
625 630 635 6-10 

Ala He Leu Glu He Gin Ala lie Thr Asn Gin He Arg Arg Leu As? 

645 650 655 

Pro Lys ?he Asn Gly He Ala He Leu Arg Thr Pro Gly Glu Pro Trp 
660 665 670 

Thr Arg His Asp Val Gin Thr Tyr Arg Gin Tyr Tyr Asn Gin Leu Arg 
675 680 685 

Glu Ser Arg Gly Phe Ala Val Glu Pro He Tyr Arg lie Arg lie Asn 
690 695 700 

Asn Gly Asn Glu Phe Asn Arg He Met Ser Ser Lys Tyr Pro Tyr Asn 
705 710 715 720 

Glu Leu Tyr Val Ala Asn Pro Lys Ser Ala Thr Gly Tyr Phe Arg Val 
725 730 735 

Asp Ser Tyr Asp Pro Ala Thr Arg Glu He He Ser Arg Lys Phe Thr 

740 745 750 

Gin Phe Ser Gin He Gin Glu Ser Thr Gly He Gly Tyr lie Lys Glu 
755 760 765 

Ala Val Arg Lys Tyr Ser Pro Gly Thr Val He Ser Asn Val Pro Ser 
770 775 780 

Thr Pro Thr Thr He Arg Gly Arg Lys Leu Glu Gly Lys Leu He Leu 
785 790 795 800 

Glu Val Pro Ala Gin Val Asn Pro lie Pro Gin Ser Val Leu Arg Ala 
805 810 815 

Ala Gin Glu Glu Asn val He He Arg Asp Thr Thr Gly Arg He Tyr 
820 825 830 



Lys 
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(2) INFORMATIONS POUR LA SEQ ID NO: 41. 

(1 ) CARACTEHISTICUES DE LA SEQUENCE : 
(A) LONGUEUR: 833 acides amines 
(3) TYPE; acide amine 
(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE : proteine 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 41: 

val Leu Lys Thr Pro Pro Thr Leu Aia Ala Glu Leu Ser Gly Lys Thr 

Gly Vai Ser lie Ser Ala Pro Tyr Ala Asn Glu Asn Ser Arg He Leu 
20 25 30 

Leu Ser Thr Thr Asp He Ser Ser Glu Asn Gly Lys He Lys He Gin 
35 40 45 

Ser Tyr Gly Asp Gin Tyr Tyr Tyr Ala Arg Gin Ser Glu Leu Tyr Thr 
50 55 60 

Phe Glu Arg Arg Ser Tyr Lys Thr Gly Lys Trp Tyr Asn Arg Lys His 
65 70 75 80 

lie Thr Glu Val Lys Glu His Lys Asn Ala Lys Pro Asp Ala Val Asn 
85 90 95 

Leu Ser Ala Ser Gin Gly He Asp He Lys Ser Gly Gly Ser He Asp 
100 105 HO 

Ala Tyr Ala Thr Ala Phe Asp Ala Pro Lys Gly Ser He Asn He Glu 
115 120 125 

Ala Gly Arg Lys Leu Thr Leu Tyr Ala Val Glu Glu Leu Asn Tyr Asp 
130 135 1*0 

Lys Leu Asp Ser Gin Lys Arg Arg Arg Phe Leu Gly He Ser Tyr Ser 
145 150 155 160 

Lys Aia His Asp Thr Thr Thr Gin Val Met Lys Thr Aia Leu Pro Ser 
165 170 I 75 
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Arg Val Val Ala Glu Ser Ala Asn Leu Gin Ser Gly Trp Asp Thr Lys 
180 185 190 

Leu Gin Gly Thr Gin ?he Glu Thr Thr Leu Gly Gly Ala Thr lie Arg 
19S 200 205 

Ala Gly Val Gly Glu Gin Ala Arg Ala Asp Ala Lys lie lie Leu Glu 
210 215 220 

Gly lie Lys Ser Ser He His Thr Glu Thr Val Ser Ser Ser Lys Ser 
225 230 235 240 

Thr Leu Trp Gin Lys Gin Ala Gly Arg Gly Ser Asn He Glu Thr Leu 
245 250 255 

Gin Leu Pro Ser Phe Thr Gly Pro Val Ala Pro Val Leu Ser Ala Pre 
260 265 270 

Gly Gly Tyr He Val Asp He Pro Lys Gly Asn Leu Lys Thr Gin He 
275 280 285 

Glu Thr Leu Thr Lys Gin Pro Glu Tyr Ala Tyr Leu Lys Gin Leu Gin 
290 295 300 

Val Ala Lys Asn He Asn Trp Asn Gin Val Gin Leu Ala Tyr Asp Lys 
305 310 315 320 

Trp Asp Tyr Lys Gin Glu Gly Met Thr Pro Ala Ala Ala Ala Val Val 
325 330 335 

Val He Val Val Thr Val Leu Thr Tyr Gly Ala Leu Ser Ala Pro Ala 
340 345 350 

Ala Ala Gly Thr Ala Gly Ala Ala Gly Ala Gly Ala Gly Gly Ala Ala 
355 360 365 

Ala Gly Thr Ala Ala Gly Thr Gly Val Ala Ala Gly Thr Ala Ala Thr 
370 375 380 

Thr Gly val Ala Ala Gly Thr Ser Ala Ala Ala He Thr Thr Ala Ala 
385 390 395 400 

Gly Lys Ala Ala Leu Ala Ser Leu Ala Ser Gin Ala Ala Val Ser Leu 
405 410 415 
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lie Asa Asn Lys GLy Asp He Asn H iS Thr Leu Lys Giu Leu Gly Lys 



420 



425 



430 



Ser Ser Thr v.l Arg Gin Ala Ala Thr Ala Ala v.l Thr Ala Gly val 



435 



440 



445 



Leu Gin Gly He Ser Gly Leu Asn Thr Gin Ala Ala Glu Ala Val Ser 



450 



455 



460 



Lys His Phe His Ser Pro Ala Ala Gly Lys Leu Thr Ala Asn Leu He 
465 <™ 45 

Asr. Ser Thr Ala Ala Ala Ser Val His Thr Ala He Asn Gly Gly Ser 
485 490 * 95 



Lys Asp Asn Leu Gly Asp Ala Ala Leu Gly Ala He Val Ser Thr 



Leu Lys 



val His Gly 
515 



5QC 505 

Giu Val Ala Ser Lys lie Lys Phe Asn Leu Ser Glu Asp 
520 "5 

His Lys He Ala His Ala Val Ala Gly Cys Ala Ser Ala 



Tyr He Ala His Lys 

530 535 



540 



val 

545 



Ala Asn Lys Gly Lys Cys Arg Asp Gly Ala lie Gly Ala Ala Val 



550 



555 



560 



Gly Glu Met Val Gly Glu Thr Leu Leu Asp Gly Arg Asp Val Gly Lys 



565 



570 



Leu Ser Pro Gin Giu Arg Gin Lys Val He Ala Tyr Ser Gin lie He 



580 



585 



590 



Ala 



Gly Ser Ala Val Ala Leu Val Lys Gly Asp Val Asn Thr Ala Val 



S95 



600 



605 



Asn Ala Ala Thr Val Ala Val Glu Asn Asn Ser Leu Leu Ala Arg Arg 



610 



615 



620 



Arg val Asn lie Arg Tr P Thr Pro Arg Gin Glu Leu Glu His Glu Tyr 
630 «5 «* 



625 



Ala 



He Leu Glu He Gin Ala lie Thr Asn Gin lie Arg Arg Leu Asp 



645 



650 



655 
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Pro Lys Phe Asn Gly lie Aia lie Leu Arg Thr Pro Gly Giu Pro Trp 
660 665 670 

Thr Arg His Asp Val Gin Thr Tyr Arg Gin Tyr Tyr Asn Gin Leu Arg 
675 680 685 

Clu Ser Arg Giy Phe Ala Val Glu Pro lie Tyr Arg He Arc He Asn 
690 605 700 

Asn Gly Asn Glu Phe Asn Arg He Met Ser Ser Lys Tyr Pro Tyr Asn 
705 710 715 720 

Glu Leu Tyr Val Ala Asn Pro Lys Ser Ala Thr Gly Tyr Phe Arg Val 
? 25 730 735 

Asp Ser Tyr Asp Pro Ala Thr Arg Glu He He Ser Arg Lys Phe Thr 
740 745 750 

Gin Phe Ser Gin He Gin Giu Ser Thr Gly He Gly Tyr He Lys Glu 
755 760 765 

Ala Val Arg Lys Tyr Ser Pro Gly Thr Val He Ser Asn Val Pro Ser 
770 775 780 

Thr Pro Thr Thr lie Arg Gly Arg Lys Leu Glu Gly Lys Leu He Leu 
785 790 795 800 

Glu Val Pro Ala Gin Val Asn Pro He Pro Gin Ser Val Leu Arg Ala 
805 810 815 

Ala Gin Glu Glu Asn Val He He Arg Asp Thr Thr Gly Arg He Tyr 
820 825 830 

Lys 



(2) INFORMATIONS POUR LA SEQ ID NO: 42: 

(i) CARACTERISTigUES DE LA SEQUENCE: 

(A) LCS4GUEUR: 162 acides arain6s 

(B) TYPE: acide amir\6 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
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fii) TYPE HE MOLECULE : peptide 



PCT/FR97/01295 



(ix) CARAC7ZHISTICUE : 

;A) NCM/CLS: Peptide 
(5) EMPLACEMENT:!. 162 



(XI} DESCRIPTION DE LA SEQUENCE: SEQ ^> NO: 42: 

Met Lys Lys Asp lie Phe Tyr Cys Giu Gin Trp Ser Tyr Gly Tyr Lys 
5 10 15 

Arg Leu His Lys Pro Phe Ser Glu Lys Gin Ala Glu Glu Lys His Leu 
20 25 30 

Lys Gly Giu Leu Tyr Thr Ala Val He Gly Ser Ala Thr Gin Pro Glu 
35 40 45 

Tyr Val He Thr Leu Arg Glu Glu Val Gly Phe Phe Ser Val Asn Phe 
SO 55 $0 

Phe Asp Lys Phe Gly Arg Asp Tyr Leu Thr His Gin Phe Gin Lys Tyr 
65 70 75 80 

Ser Asn Ser Asn Tyr Tyr Phe Leu Ser Met Ala Val Trp Arg Asp Tyr 
85 90 95 

lie Thr Leu Glu Ser His Asp Leu Ala Glu Gly Tyr Thr Tyr Phe Phe 
100 ^05 HO 

Asn Glu Asn Thr Asp Asp Cys Tyr Val Leu Lys Gin Asp Phe He Asn 

115 120 125 

Asn Glu Arg Tyr Glu Lys Thr Glu Leu Tyr Ser Gin Lys Asp Lys Val 
130 135 140 

lie Leu Phe Pro Lys Phe Gly Glu Tyr Asp Leu Val Leu Asn Pro Asp 
145 150 155 160 

lie lie 



(2) INFORMATIONS POUR LA SEQ ID NO' 43: 
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(i) CASACTZRISTIQUES CE LA SEQUENCE: 

(A) LONGUEUR 90 acides amines 

(B) TYPE: acide amine 

(C; NOMBRE DE BRINS simple 
(D) CONFIGURATION: iineaire 

Uil TYPE DE MOLECULE: peptide 



(ix) CARAC7ERISTIQUE : 

(A) NOM/CLE: Peptide 

(B) EMPLACEMENT : 1 . .90 



Cci) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 43: 

Met Asn Lys Arg Met Lys Met Cys Pro Ala Cys Gin Gin Gly Tyr Leu 
15 10 15 

Tyr His Ser Lys Pro Lys Tyr Leu His Asp Glu lie lie Leu Cys Asp 
20 25 30 

Glu Cys Asp Ala Val Trp Leu Lys Gly Met Asn lie Phe Tyr Gly Glu 
3S 40 45 

Tyr Glu Lys Asp Phe Tyr Ser Tyr Val Pro Phe Met Glu Ser Gin Gly 
50 55 60 

He Thr Ser Glu Cys He Trp Glu Gly Asp Leu Phe Asp His Pro Tyr 
65 70 75 80 

Tyr Glu Asp Glu Asn Ser Asn Asp Met Asp 
85 90 

(2) INFORMATIONS POUR LA SEQ ID NO: 44: 

( i ) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 313 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineatre 

(ii) TYPE DE MOLECULE: peptide 
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(1X1 CARAC73JUSTICUE: 

(A) NOM/CLE: Peptide 
(3) EMPLACEMENT : 1 .313 



i:<i) DESCRIPTION DE LA SEQUENCE. SEQ ID MO: A A 

Met Ser Ala Thr Glu He Glu Lys Aia Lys Ala Lys lie Thr Ala Tyr 
15 10 I 5 

Ser Lys Leu v a l Ala Gly Thr Ala Ser Ala Val Val Gly Gly Asp Val 
20 25 30 

Asn Thr Ala Ala Asn Ala Ala Gin He Ala Val Glu Asn Asn Thr Leu 
35 40 45 

Tyr Pro Arg Cys Vai Gly Ala Lys Cys Asp Glu Phe Gin Lys Glu Gin 
c 0 55 60 

Gin Lvs Trp He Arg Glu Asn Pro Glu Glu Tyr Arg Glu Val Leu Leu 
65 70 75 B0 

Phe Gin Thr Gly Phe lie Pro He lie Gly Asp He Gin Ser Phe Val 
85 90 *5 

Gin Ala Gin Thr Aia Ala Asp His Leu Phe Ala Leu Leu Gly Val Val 
100 105 HO 

Pro Gly lie Gly Glu Ser He Gin Ala Tyr Lys Val Aia Lys Aia Ala 
115 120 125 

Lys Asn Leu Gin Gly Met Lys Lys Ala Leu Asp Lys Ala Ala Thr Val 
130 135 140 

Ala Thr Ala Gin Gly Tyr Val Ser Lys Thr Lys He Lys He Gly Gin 
145 150 155 160 

Thr Giu Leu Arg Val Thr Ala Ala Thr Asp Lys Gin Leu Leu Lys Aia 
165 170 175 

lie Gly Glu Gly Arg Asp Thr Thr Gly Lys Met Thr Glu Gin Leu Phe 
180 185 190 

Asp Ser Leu Aia Lys Gin Asn Gly Phe Arg Val Leu Ser Gly Gly Lys 
195 200 205 
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Tyr Giy Gly Asn Asn Gly Phe Asp His Val Trp Gin Ala Ala Asp Gly 
210 215 220 

Ser Val Val Leu lie Val Glu Sar Lys Gin II© Arg Asn Gly Thr Val 
225 230 235 240 

Gin Lou Asn Pro Asn Gly Ala Gly Gly Tyr Thr Gin Met Ser Glu Asp 
245 250 255 

Trp lie Arg Gin Vai Leu Asp Gin Leu Pro Asp Gly Ser Pro Aia Lys 
260 265 270 

Ala Ala Val Phe Lys Ala Asn Lys Asn Gly Thr Leu Lys Thr Ala lie 
275 280 285 

Ala Gly Val Asp Arg Gin Thr Gly Lys Ala Vai lie Leu Pro Val Lys 
290 295 300 

Val Pro Ser Lys Thr Asn lie Arg Arg 
305 310 

(2) INFORMATIONS POUR LA SEQ ID NO: 45: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 311 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lmeaire 

(ii) TYPE DE MOLECULE: peptide 



Ux) CARACTERISTIQUE : 

(A) NOM/CLE: Peptide 

(B) EMPLACEMENT : 1 . .311 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 45: 

Met Gly His Asn Met Met Thr Thr Gin Lys Trp Tyr Glu His He Thr 
* 5 10 15 

Asn Vai He He Gly Asn Thr Ala Asn Phe Asn Ser Gly Cys Leu Asp 

20 25 30 
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Ser lie Asp Tyr Val Asp Glu Arg Lys Gly Val Pro Leu Ala Ala Met 
35 40 < 5 

Gin His lie Phe Met Asp Val Arg Ala Ala Ala Ser His Ala Tyr Leu 



50 



55 60 



Phe Glu His Asp Leu Lys Lys Phe Lys Gin Tyr Ala Tyr val Ala Gly 
65 70 75 80 

Lys Leu Gly val Leu Leu Ser Val Asn Ser Thr Asp Pro Glu Pro Phe 
85 90 95 

Phe Phe Pro Cys Asp Met Leu Asn lie Gin Asn Pro Met Phe Leu Met 
100 105 HO 

Leu Met Ser Asp Ser Pro Gin Leu Arg Glu Phe Leu Val Arg Asn lie 
US 120 I 25 

Asp Asn lie Ala Asn Asp Thr Glu Ala Phe He Asn Arg Tyr Asp Leu 
130 135 KO 

Asn Arg His Met He Tyr Asn Thr Leu Leu Met Val Glu Gly Lys Gin 



145 



150 155 "0 



Leu Asp Arg Leu Lys Gin Arg Ser Glu Lys Val Leu Ala His Pro Thr 
165 170 175 

Pro Ser Lys Trp Leu Gin Lys Arg Leu Tyr Asp Tyr Arg Phe Phe Leu 
180 185 I" 

Ala Phe Ala Glu Gin Asp Ala Glu Ala Met Lys Ala Ala Leu Glu Pre 
195 200 205 

Leu Phe Asp Lys Lys Thr Ala Arg Met Ala Ala Lys Glu Thr Leu Ser 
210 215 220 

Tyr Phe Asp Phe Tyr Leu Gin Pro Gin lie Val Thr Tyr Ala Lys He 
225 230 235 240 

Ala Ser Met His Gly Phe Asp Leu Gly He Asp Gin Glu He Ser Pro 
245 250 255 

Arg Asp Leu He Val Tyr Asp Pro Leu Pro Ala Asp Glu Tyr Gin Asp 
260 2«5 270 
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He Phe Asp Phe Met Lys Gin Tyr Asp Leu Ser Tyr Pro Tyr Glu Tyr 
275 280 285 

Leu Gin Asp Trp lie Asp Tyr Tyr Thr Phe Lys Thr Asp Lys Leu Vai 
290 295 300 

Phe Gly Asn Ala Lys Arg Glu 
305 310 



(2) INFORMATIONS POUR LA SEQ ID NO: 46: 

(i> CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(CI NOMBRE DE BRINS : simple 
(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genonuque) 



(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 46: 
GCCACCGGTA CGGAAACTGA A 
(2) INFORMATIONS POUR LA SEQ ID NO: 47: 

(i) CARACTERISTIOUES DE LA SEQUENCE: 

(A) LCWGUEUR: 30 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIOUE: NGN 
(iv) ANTI-SENS: NON 
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(Xi) DESCRIPTION DE LA SEQUENCE : SEO ID NO: 47. 
CCTGAATTCA TGTCTATTCC ATTTTGAAGA 
(2) INFORMATIONS POUR LA SEQ ID NO: 48: 

(i) CARACTER I ST I QUES DE LA SEQUENCE : 

(A) LONGUEUR: 31 paires de bases 

( B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: iineaire 

(ii) TYPE DE MOLECULE : ADN (genomique) 
liii) HYPCTHETIQUE : NON 
(iv) ANTI-SENS: NON 



PCI7FR97/01295 



30 



(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 48: 
CCGAGATCTT TAACCCTTTG GGCTTAAGCG A 
(2) INFORMATIONS POUR LA SEQ ID NO: 49: 

( i ) CARACIERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 29 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS' simple 

(D) CONFIGURATION: Iineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 



(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 49: 
GGGAGATCTC CCGCTOGTGT TGTGCATTA 
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(2) INFORMATIONS POUR LA SEQ ID NO: 50: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 23 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BR INS : simple 

(D) OONFIGURATICN : lindaire 

(ii> TYPE DE MOLECULE: ADN (genoraique) 
(lii) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 50: 
AAGAGATCTG CAGCCAAGGC TCTCGAAA 28 
(2) INFORMATIONS POUR LA SEQ ID NO: 51: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 26 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineal re 

(ii) TYPE DE MOLECULE : ADN (genomique) 
(iii) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 51: 
GGGAGATCTC AGGCTGCCGC CGTTGA 26 
(2) INFORMATIONS POUR LA SEQ ID NO: 52: 
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li) CARACTERISTIOUES DE LA SEQUENCE : 

(A) LONGUEUR : 28 paires do bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
{D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE ADN (genomique) 

Ilii) HYPOTHETICUH : NCN 

(iv) ANTI-SENS : NON 



(xi) DESCRIPTION DE LA SEQUENCE : SEO ID NO: 52: 
GGGAGATCTC ACCCCAAGAA CGCCAAAA 
(2) INFORMATIONS POUR LA SEQ ID NO: 53: 

U) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 31 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE: NON 
(iv) ANT I -SENS . NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 53: 
GGGAGATCTG AACGTATAGT AATCTATCCA A 
(2) INFORMATIONS POUR LA SEQ ID NO: 54: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 12 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE: ADN (genomique) 
(ill) HYPOTHETIQUE : NON 
(iv) ANT I -SENS : NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 54: 

AGTGGCTCCT AG ;2 

(2) INFORMATIONS POUR LA SEQ ID NO: 55: 

U) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 24 paires de bases 
fB) TYPE : nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineai re 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(ill) HYPOTHETIQUE: NON 
(iv) ANTI-SENS : NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 55: 
AGCAC7CTCC AGCCTCTCAC CGAG 24 
(2) INFORMATIONS POUR LA SEQ ID NO: 56: 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 12 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 

(Xi) DESCRIPTION DE LA SEQUENCE. SEQ ID NO: 56: 
AGTGGCTCTT AA l2 
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(2) INFORMATIONS POUR LA SEQ ID NO: 57: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 10 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lmeaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE : SON 
(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO. 57: 
AGTGGCTGGC 10 
(2) INFORMATIONS POUR LA SEQ ID NO: 58: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 24 paires de bases 

(B) TYPE : nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(ill) KYF CTHET I QUE : NON 
I iv) ANTI-SENS: NON 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 58 : 
ACCACTCTCC AGCCTCTCAC CGAC 2 < 
(2) INFORMATIONS POUR LA SEQ ID NO: 59: 

H) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 12 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lindaire 
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(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE : NON 
( iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE. SEQ ID MO: 59: 
GTACTTGCCT AG 12 
(2) INFORMATIONS POUR LA SEQ ID NO: 60: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 24 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE: NON 
(iv) ANTI-SENS : NON 

(XI) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 60: 
ACCGACGTCG ACTATCCATG AAOG 2 4 

(2) INFORMATIONS POUR LA SEQ ID NO: 61: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 12 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETI0UE: NON 
(iv) ANTI-SENS: NON 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 61: 
CTACTTGCTT AA 12 
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(2) INFORMATIONS POUR LA SEQ ID NO: $2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

<A) LONGUEUR : 10 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
CiiJ HVPOTHETIQUE: NON 
(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 62: 
GTACTTGGGC 

(2) INFORMATIONS POUR LA SEQ ID NO: 63: 

(i) CARACTERISTIOUES DE LA SEQUENCE: 

(A) LONGUEUR: 2 4 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(ill) HYPCTHETIQUE : NON 

(IV) ANTI-SENS: NON 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 63: 
ACCGACGTCG ACTATCCATG AACC 
(2) INFORMATIONS POUR LA SEQ ID NO: 64 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 12 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineaire 
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(li) TYPE DE MOLECULE: ADN (gSnomique) 
(iii) HYPOTHETigUE : NON 
(iv) ANTI-SENS : NON 

(Xil DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 64: 
AATTCTCCCT CG 

12) INFORMATIONS POUR LA SEQ ID NO: 65 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 24 pa ires de bases 

(B) TYPE : nucleotide 

(C) NOMBRE DE BR INS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (gSnoraique) 
(iii) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 65: 
AGGCAACTGT GCTATCCGAG GGAG 

(2) INFORMATIONS POUR LA SEQ ID NO: 66: 

(i) CARACTER I STI QUES DE LA SEQUENCE: 

(A) LONGUEUR: 140 paires de bases 

(B) TYPE : nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE: NON 
(iv) ANTI-SENS: NON 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 66: 
GATCAACTTT TCCCTCTTTG TCCCATTACC GGTTTGAATG AACCGATTCC GCGCCGCGCG 60 
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TGTTGTTGGA CATTACCT3C GATTCAGACG GTACGAT7GA CCACTACATC GAGGAGAACG 120 
GCAATCAGGC TACAATGCTA 140 
(2) INFORMATIONS POUR LA SEQ ID NO: 67: 

( i ) CARACTERISTIQUES DE LA SEQUENCE 

(A) LONGUEUR: 192 paires de bases 

( B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(li) TYPE DE MOLECULE: ADN (genomique) 
(lii) H YPOTHET I QUE : NON 
(iv) ANTI-SENS : NON 

(XI) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 67: 
GATCCGCGTA CTTGGTTTH CATATTTTGC ATAGTCTTGT CGGTCGGGCA 7CTTCCCCGA 
CATCATC7AA ATTTGTCTTT ATTGGTTTTT ACGCCACTCA TTGCGGATAA ACAATATTCC 
GCCTTGCCGT CGCGAATGTT CAAGCTAGCC TGCATCACC3 TAATCAGGTT GCCCGTTACC 



GAGCCTTCGA GA 

(2) INFORMATIONS POUR LA SEQ ID NO: 68: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

I A) LONGUEUR: 183 paires de bases 
(3) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE : NON 
(iv) ANTI-SENS : NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 68: 
GATCCGGCTG CCCGAOGCGC GCAAAATTCC CGCCGAGGAA AGCCCGCACA ACCACGACGG 



60 
120 
18C 
192 



60 
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CAAAACCAGC GTATGGCAAT ACAAACATC? CGTGTTCGGT ACGGCAGGCA T77TC7GCTA 120 

TGTCGGCGC3 GAGGTGTC7A TCGGTTC3TT GATGGTCAAC GTAT7CGGTT A7CTGAAAGG 130 

GCTGGATC IS 3 
(2) I H FORM ATI CNS POUR LA SEQ ID NO: 69 

U) CARACTZRIS7IQUES DE LA SEQUENCE: 

(A) LONGUEUR: 304 pa ires de bases 

(B) TYPE: nucleotide 

iC) NCMBRE DE BRINS: simple 
(D) CONFIGURATION: lineaire 

Hi) TYPE DE MOLECULE . ADN (genomique) 

( i i ; I HVP OTHET I QUE NGN 

(iv) AMTI-SENS: NON 

(XI) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 69: 
GATCCCCCAC TTTACCTCGG GCAGATTTTG CGCGTTCATT ACAATAGCGT ATTTATGC5T 60 
TTGCGTTTGC G CTTGCCG CT GCCZCZCZZC CGCCGGTATG GGAAAACATC AATATGGCGG 120 
TATAAAGCGC GGTATGGCGG AAAACCTGCC GTTTCCAAGT TTTATTCATC TTTTATTCCT 180 
TGAGTTTGCC TTCACGGGAC GGGGCGGCGC GCGGAACGCG GGGTTCGGTA AACCGCCCGA 24 0 

TTCCGCGCCC GCCGAATTGC TGATTGAAAA GCTTACTTCC CCATTTTAAC TTTGCACACT 200 
GATC 30 4 

(2) INFORMATIONS POUR LA SEQ ID NO: 70: 

(i) CARACTERISTIQUES DE LA SEQUENCE . 

(A) LONGUEUR: 243 paires de bases 

(B) TYPE: nucleotide 

(C) SOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineaire 



(ii) TYPE DE MOLECULE: ADN (gSnomique) 
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Uv) ANTI-SENS . NON 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO; 70: 
GATCAGACCC A7TTTCAGCG CACCGTAAGC GCGGAT77TC TCGAATTTTT CCAAAGCT3C 5*' 
GGCATCGTTG TTGATGTCGT CTTGCAACTC TTTGCCC3TG TAGCCCAAGT CGGCGGCA7T 120 
CAGGAAAACG GTCGGAATGC CCG CGTTGAT GAGCGTGGCT TTCAAACGGC CTATATTCGG 130 
CACATCAATT TCATCGACCA AATTGCGGGT TGGGAACATA CTGCCTTCGC CGTCGGCTGG 2^0 
ATC 243 
(2) INFORMATIONS POUR LA SEQ ID NO: 71 

(i) CARACTERI STIQUES DE LA SEQUENCE 

(A) LONGUEUR . 236 paires de bases 

(B) TYPE : nucleotide 

(C) NOMBRE DE BR INS : simple 

(D) CONFIGURATION: lineaire 

Ui) TYPE DE MOLECULE: ADN (genomique) 
fiii) HYPOTHETIQUE: NON 
(IV) ANTI-SENS: NON 

(x:j DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 71: 

CGGCGGCGTAGTcc^ccGcMCAGCGTTACCATAAGCGGGACAGACTACACCCCTTTATCT 
AACCCGCAAAGTTTGGATACGGAATTAAAATG^ 

AAAATCCTTTCGACCGCGCCGTTTATCTCCATAATAATTTGGCGTATCTTCA^ 
AAAGATTGCAATAAACGTACTGCCAGAAACTGCATGACCTTGTCGCTGATGCGCTCCG 

(2) INFORMATIONS POUR" LA SEQ ID NO: 72: 

(i) CARACTERI STIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 280 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BR INS: Simple 

(D) CONFIGURATION: lineaire 
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I US TYPE DE MOLECULE XZU (genomique) 
Uiil KYPOTHETICUE: HON 
(iv) ANT I -SENS : NON 

lXi5 DESCRIPTION DE LA SEQUENCE : SEQ ID HO: 7: : 
CGGTCAATCA CAAGAAAGTC AGCCGTCTGA TGGCGAAGAC GGGGCTGAAG GCAGTGATAT 60 
GGCGGCGCAA ATACCGCTCG TTCAAAGGAG AACTCGGCAA AATTGCGCCG AATATCCTGC 120 
GACGCTGTTT CCATGCAGAA AAGCCGAATG AGAAATGGGT AACGGACGTT GCCGAGT7CA ISO 
ATGTAGGCGG AGAAAAGATA TACCTT7C7C CGATTATGGA TTTGTTTAAC GGGGAAA7CG 240 
TCAGTTACC3 TATTCAGACC C3CCCGACT7 TCGATTTGGC 280 
12) INFORMATIONS PCUR LA SEC ID NO; 73: 

( l) CARACTZRISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 120 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE 3RINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(ill ) HYPOTHETIQUE: NON 
(iv) ANTI-SENS: NCN 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 73: 
CGGTCAGAAA CAGGCAAGGT AATGAAAATG CCTGAGGCAC GGACTGTGCT GCGAACGAAA $0 
ACTCCTTACC GAAGTCTTCT ATACCCAGGC TCAATAGCCG CTCAAGGAGA GAGCTATCAT 120 
(2) INFORMATIONS POUR LA SEQ ID NO: 74: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 120 paires de bases 

(B) TYPE: nucleotide 

IC) NOMBRE DE BRINS: simple 
(D) CONFIGURATION, lineaire 



BNSDOCICT <WO_9e02S47A2J_ > 



FEUILLE DE REPLACEMENT (REGLE 2§) 



WO 98/02547 



PCI7FR97/01295 



117 

Ui) TYPE DE MOLECULE: ADN (genomique) 



(iii) HYPOTHETIQUE: NON 



(iv) AMTI - SENS ' NON 



(XI) DESCRIPTION DE LA SEQUENCE SEQ ID 



NO: 7.1 



CGGTCAGAAA CAGGCAAGGT AATGAAAATG CCTGAGGCAC 



GGACTGTGCT GCGAACGAAA 



60 



ACTCCTTACC GAAGTCTTCT ATACCCAGGC TCAATAGCCG 



CTCAAGGAGA GAGC7ATCAT 



[2) INFORMATIONS POUR LA SEQ ID NO: 7$: 

(1) CARACTERISTIQUES DE LA SEQUENCE. 

(A) LONGUEUR: 152 pa ires de bases 
:3i TYPE . nucleotide 

(C) NOMBRE DE BR INS : simple 

(D) CONFIGURATION : lineaire 

TYPE DE MOLECULE: ADN igenomique) 
[Hi) KYrCTHETIQUE : NON 
(iv) ANTI-SENS: NON 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO; 75: 

C3GTGTTTT7 CTTAACAATT CGCCGACTTC ATGGCGATAT TTAAGTGACA GTTGCTCCGC 50 

CCACGCACTT GCGCCGAA CT CAGCACCACG ACATTATACT CATTATGCAC ATCGGCAAGA 120 

TCAAACTGAC CTATCGTAGT ATCGCAGACT GT 152 

(2) INFORMATIONS POUR LA SEQ ID NO: 76 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR . 381 paires de bases 
(3) TYPE" nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE . ADN (genomique) 
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(iv) ANT I -SENS : NGN 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO 76. 

CGGGAGGTTTTGTGCATCCTGATACCGATCGGTTGTTGTTGCTCAAAGGACAGAAGGC 

CGCTGATAAACGAGATTACCTGTTTGTCGCTATTGACGA 1 1 1 1 1 1 ATACTCTGCCATTTT 

GCCAGACAAAACCGCAGACAGTGCTGCCAAGTTTCTGACCGAACATCTGGCCGACCCC 

TGCTTGT ACCTG ATTGAG TACG CTTACTCTGACAATGATAGGTAATATAAAGAGCCGTC 

CAACATGCTTTCGGTGCAGTTTGTTATGATAATGGGATTGGTTGGAGGCTTGCCC 

TGCTTGTCCGCAGACCAACGGTAAGGCGGAGCGGGTTATCCGTACCTTGATGGAGATG 

TGGCATGAGGAACAGTCGTTTGACAGACCG 

(2) INFORMATIONS POUR LA SEQ ID NO: 77 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR. 269 paires de bases 

(3) TYPE: nucleotide 

[C\ NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(li) TYPE DE MOLECULE: ADN ( ge nonuque ) 

(iii) HYFOTHETIQUE: NON 

(ivf ANTI-SENS: NON 

(XI) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 77: 
CGGAGCATAA AATCGTTATT AAAGATAATG GTATAGGAAC GAGCTTCGAT GAAATCAATG 60 
ATTTTTATTT GAGAATCGGT CGGAACAGAA GGGAAGAAAA ACAAGCCTCC CCCTGCGGAA 120 
GAATTCCAAC GGGTAAAAAA GGCCTTGGTA AATTGGCATT ATTCGGGCTT GGCAACAAAA 180 
TTGAAATTTC TACTATCCAG GG AAA CG AAA GGGTTACTTT TACTTTGGAT TATGCAGAGA 24 0 

TTCGAAGAAG CAAGGGTATT TATCAACCG 269 
(2) INFORMATIONS POUR LA SEQ ID NO: 78 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 203 paires de bases 

(B) TYPE: nucleotide 



FEUILLE DE REMPLACEMENT (REGIE 2§) 



BNSOOCIO: <WO 9602547*2 1 > 



PCT/FR97/O1205 

WO 98/02547 

119 

( C) NOMBRE DE BR INS simpi* 

(D) CONFIGURATION: Uneaire 

(ii) TYPE DE MOLECULE . ADN (genomique) 
(iii) HYPOTHETIQUE: NON 

(iv) ANTI-SENS NCN 

(xl) description cz la sequence : seq id no: 78: 
cggcgStg^ 

tgtagatgaagctcaagacgtatggccg 

(2) INFORMATIONS POUR LA SEQ ID NO: 79: 

|i) CARACTER I ST I CUES DE LA SEQUENCE: 

(A) LONGUEUR : 229 paires de bases 

(B) TYPE: nucleotide 

5 CI NOMBRE DE BRINS: simple 
(D) CONFIGURATION lmeaire 

(IX) TYPE DE MOLECULE: ADN (genomique) 

(iii) HYPOTHETIQUE - NON 
(iv) ANTI-SENS: NON 

(Xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 79 
CGGTTTCAGG TTGTCGCGAA GGCTCGGTAA CGGGCAACCT GATTACGGGT GATGCAGGCA 
GCTTGAACAT TC5CGACGCC AAGGCGGAAT ATGTTTATCC GCAATGAGTG GCGTAAAAAC 
CAATAAAGAC AAATTTAGAT GATGTCGGGG AAGATGCCCG ACCGACAAGA CI ATGCAAA A 
TATCAAAAAC CAAGTAOGCG GATCAGGCAT GGATGCACGA TCCAATCCG 
(2) INFORMATIONS POUR LA SEQ ID NO: 80: 

(i) CARACTER I ST I QUE S DE LA SEQUENCE: 

(A) LONGUEUR: 207 paires de bases 

(B) TYPE: nucleotide 



60 
120 
180 
229 
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(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: Uneaire 

TYPE DE MOLECULE: ADN (genomxque) 
(Hi) K YPOTHET I QUE : NON 
liv) ANT I -SENS : NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 80. 

CGGGTCGCTT TATTTTGTCC AGGCATTATT TTTCATTTTT GGCTTGACAG TTTGGAAATA 60 

TTGTGTATCC GGGGGGGGTA TTTGCTGACG TAAAAAACTA TAAACGCCGC GCAAAATATG i 20 

GCTGACTATA TTATTGACTT TGAT7TTGTC CTGCGCGGTG ATGGATAAAA TC3CCAGCGA 180 

TAAAGAATTT GCGAGAACCT GATGCCG 

(2) INFORMATIONS POUR LA SEQ ID NO: 81 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

tA) LONGUEUR: 224 paires de bases 
(3) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE. ADN (genomique) 
(iii) HYPOTHET I QUE : NON 
<xv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 81. 
CGGCAAOGAT TTGAGCTATC GCGGTTACGA CATTCTGGAT TTGGCACAAA AATGCGAGTT 
TGAAGAAGTC GCCCACCTGC TGATTCACGG CCATCTGCCC AACAAATTCG AGCTGGCCGC 
TTATAAAACC AAGCTCAAAT CCATGCGCGG CCTGCCTATC CGTGTCATTA AAGTTTTGGA 
AAGCCTGCCT GCACATACCC A7CCGATGGA CGTAATGCGT ACCG 
(2) INFORMATIONS POUR LA SEQ ID NO: 82: 



60 
120 
160 
224 
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(i) CAJUCTERI5TIQUES DE LA SEQUENCE : 
(A) LONGUEUR: 212 pa ires de bases 
(3) TYPE: nucleotide 
(C) NCMBFE DE BR INS: simple 
<D) CONFIGURATION : Uneaira 

ill) 7VPE DE MOLECULE : ADN (genomique) 

(ill) KYPCTHETIQUE : NON 

(iv) ANTI -SENS: NON 

(Xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 82. 

CGGGAACAGC CATTGCCCAC GCCCACGCCC CCCAAGAAAG ACGGAAACTA CTGCCTAAAT 6C 

TTTCGGCAAT CAAGTTGACG ATTAAAGGGT TGGGGGCAGT TGCAGTAATA AACATAGCCG 120 

ACGAAATGGG A7TGGAATGA TAGTTGACCA AAGCCAAA7A TTTACCCATC TTGCCTTCTG 130 

TGCCTTTTGC GGGATTGGAG CCGTAACTGC CG 212 

(2) INFORMATIONS POUR LA SEQ ID NO: 8 3 

( i ) CARACTERISTIQUES DE LA SEQUENCE . 

(A) LONGUEUR: 353 paires de bases 
(3) TYPE : nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE . ADN (genomique) 
( ill ) HYPOTKET I QUE : NON 
(iv) ANTI-SENS: NON 

(XI) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8 3 
CGGGAATTCT GAGCAGAATG AAAGAAAGCA GGCTTGATAA TTTCATAAAG TTATTGGAAG 60 
AAAAAGGATT TACCGTCCAT TTCGGTATTC ACAATACGGC TGATTACGGA ATTCCCCAAA 120 
GCCGTAAAAG ATTTAOGTTA ATTGCAAACA GAATAACCAA AGAAAAGCTG GAACCAGTCA 180 
AGTATTCGGG CAAAOGGCTT ACGGTAGCCG ATGTTTTGGG AATGGAAATG GCTTTCCCAA 240 
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CATTATTGCA GGACACCAAG ACGAAACGGA TTTTATGCAT AGCTGTGC3G GAATTATCTG 3CC 
ATATCACTTG AACGATTGGC TTGATACCTA AAAACGGAGG AACCGTTGGC TTT 2t2 
(2) INFORMATIONS POUR LA SEQ ID NO: 84: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 308 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(ill ) HYPOTHETIQUE : NON 
(iv) ANTI-SENS : NON 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 84: 
AATTCCGTAT CCAAACTTTG CGGGTTAGAT AAAGGGGTGT AGTCTGTCCC GCTTATGGTA 60 
ACGCTGTCGC GGCGGACTAC GCCCGGAGCC TTTTTCCAGT AAGTTTTCGG AAATCAGGCT 120 
GTGGGTGGTT TTTAAGAAAT CCAACCAGTC AAACGGCTCG GGGCTGTCCA AACCGGACAC 180 
AGGTGCCGGT AACTTTCCCT CAGGTTGATT AACATTACGG CATCCGAATA TAACITCCCG 24 0 

CCTGCGGTTT GCCCGAGTTT AAGCAATGCC TGCGTATCGT ATTGATTATA AAGTGTTTCC 300 
TTCCAATT 30o 
(2) INFORMATIONS POUR LA SEQ ID NO: 85: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 104 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE : NON 
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(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO 85: 

AA7TCCTGTG CC3CGTCGAC AAACCGCTGA CGTAGCGGAT GTCTCATGCC ACGTTTCAAA 50 

GCAGGTTGAT GGCGGTTAGC AACCCTC7GA TTTCACTGGG ATAT 104 

(2) INFORMATIONS POUR LA SEQ ID NO 86: 

( i ) CARACTERISTIQUES DE LA SEQUENCE . 
(A| LONGUEUR 89 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS . simple 
f D) CONFIGURATION: lineaire 

{li) TrTE DE MOLECULE. ADN igenomique) 

(ill) HYPOTHZTIQUE . NON 

(iv) ANTI-SENS NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 86: 
AATTGCGTAG AGTGGGCTTC AGCCACGTTT TTTCTTTTTC GGTCGTTGAT TGGTGGGCTG 60 
AACCACTTGT TTCGGAAATC CGTATCATG 8 9 

(2) INFORMATIONS POUR LA SEQ ID NO: 87: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

( A ) LONGUEUR: 273 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPCTHETIQUE : NON 
(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 87: 
AATTTCCACC TATGCCCTAC GCAGCGATTA TCOGTGGTTT ACCCAAAGGG TGATTATGGC 60 
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AAAAGCGCGC- GGTTGAGCGA CCGCC77TTG TTGCCGGCGT TCAAACGGGT 77TGATAGGA 

AATGCAGGCA CGAAGCCTC3 GCTGATTGTG ATGCACCTGA TGGGTTCGCA CAGTGATTTT 

TGCACACGTT TGGATAAGGA TGCGCCGCGG TTTCAGTATC AAACTGAAAA AATATCC7GC 

TATGTTTCCA TCAATOG CGC AAACCGATAA ATT 

(2) INFORMATIONS POUR LA SEQ ID NO: 88: 

i l ) CARACTERISTICUES DE LA SEQUENCE : 

(A) LONGUEUR: 2?0 paires de bases 
(3) TYPE: nucleotide 

(C) NCMBRE DE BRINS: simpie 

(D) CONFIGURATION, lineaire 



120 
ISO 
240 

273 



(ii) TYPE DE MOLECULE ADN (genomique) 



(ill) KYPOTHET I QUE : NON 



(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE. SEQ ID NO: 88: 

AATTCTTCCG CACGGGGAGG CTTGTTTTT C TTCCCTTCTG TTCCGACCGA TTCTCAAATA 

AAAATCATTG ATTTCATCGA AGTTCATTCC TATACCATTA TCTTTAATAA CGATTTTATG 

CTCCGGTTTA TCGAATAACC TAACTTCCAC TTCCGTAGCA CATGCATCGT AGGCATTCGC 

TATCAACTCG GCAATCGCAG GAACAGTGTG CGAATACAAT CTTTACACCC AAATGTTCCA 

TTACGGTTGG CTCGAAACTC AATTTCAATT 

(2) INFORMATIONS POUR LA SEO ID NO: 89: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2S7 paires de bases 
(3) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE : ADN (genomique) 



60 
120 
180 
240 
270 
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( li; I HVPOTHETIQUB : NON 
(iv) ANT I -SENS . NON 

(xi) DESCRIPTION DE LA SEQUENCE . SEQ ID NO: 89: 

AATTATGAAC ACACGCATCA TCGTTTCGGC TGCGTTCGTT GCGTTGGCAT TAGCAGGTTG 

CGGCTCAATC AATAATGTAA CCGTITCCGA CCAGAAACTT CAGGAACGTG CCGCGT77GC 

CTTGGGOGTC ACCAATGCCG TAAAAATCAG CAACCGCAGC AATGAAGGCA TACGCATCAA 

CTTTACCGCA ACTGTGGGTA AGCGCGTGAC CAATGCTATG TTACCAGTGT AATCAGCACA 

ATCGGCGTTA CCACTTCCGA TGCAATT 

(2) INFORMATIONS POUR LA SEQ ID NO: 90: 

(i) CARACTERI STIQUES DE LA SEQUENCE 

(A) LONGUEUR: 234 paires de bases 
(3) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE ADN (genomique) 
(iii) HYPOTHETIQUE: NON 
(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 90: 
AATTTTTATT TG G TT CIS TAG TCATTTTGTG CAACTGAACG ATATTCGTTT TCATCATTGC 
TAACGTCTAG TGCCCATTGT GGCCCGTAAT AAGAGATTTC GTCTCCTTTT ACATGTTTGA 
CGCTGACGGC ATACTGGGGA TCGATGACGG ATAATGTACG TCTGTTGACA TC7GCAAGGC 
TAAATCAATC ATCGGTATTG GATAATGCGT TGCCGATGTT TTGACTTGTA TGTT 
(2) INFORMATIONS POUR LA SEQ ID NO: 91: 

(i) CARACTERI STIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 295 paires de bases 

(B) TYPE: nucleotide 



60 

i:o 

180 
240 
267 



60 
120 
180 
234 
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;C) NCMBRE CE BRINS: Simple 
iD) CONFIGURATION : lineaire 

TYPE DE MOLECULE ADN (genomique) 

(in) KYPOTHETIQUE : NON 

( iv) ANTI-SENS NON 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 91: 

AATTCGG CCG GCTGTGTCAA ATAATGCGTT ACTT7GGCCG GGTCT TGTT C TTTGTAAGTG 50 

GTGGTCTTTT TTTGCGCGTT ATCCCCATCT GTTTGAGTGC ATAGCAAATG GTGGCTGCCG 120 

TACAATCAAA TGTTTGGCGT TCATGCAGAT AGGCATCATG GTGTTGCCCA ATATATTGAG 18C 

CCGGTTTTTG CC7ATCCGAT TTGACGGCAT TTAGACCGGT AACTTGATGT TTTAAGCTGC 240 

CTGTTTGTTT AAAGGCGAAT CCACAAGTAA AGC GTGTTT C TTGACAGGTT AAACG 295 

(2) INFORMATIONS POUR LA SEQ ID NO: 92. 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 259 paires de bases 
(3) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE : ADN (genoraique) 
(iii) HYPOTHETIQUE : NON 
(iv) ANTI-SENS : NON 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 92: 
AATTGTGTAT ATCAAGTAGG ATGGGCATTT ATGCCTGACC TACAAAACCA AAAACAACCT 60 
ACCACCCTTA ATCAACTCCA CAAACCCTCT TCAGACAACC TCGTTTTTTG AAAAACAATC 120 
TGTAAACAGA TAACTGCTGA AGAATACCGT TGCCGAGCCC CAAAACCCGT ACTGCAACTT 180 
TTATTGTGAA CTTCCCATTA TGAGAAAATC CCTTTTCGTC CTCTTTCTGT ATTCGTCCCT 2 40 
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ACTTACTGCC AGCGAAATT 



259 



(2J INFORMATIONS POUR LA SEQ ID NO: 93: 

(i) CARACTERISTIQUES DE LA SEQUENCE 

(A) LONGUEUR: 379 paires de bases 

(3) TYPE: nucleotide 

(C) NOMBRE DE BRINS. simple 

ID) CONFIGURATION: lmeaire 

(li) TYPE DE MOLECULE: ADN (genonuque) 

ilii) HYPCTHETIQUE : HON 

(lv) ANTI-SENS : NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 93; 



AATTGCACCA C3CGATGATG GGTACGCCTC TGTTGCCATT GCGACCGCCG COGCCGTGCC 



60 



CGGTACGCTG G7CAACCTTG CCGCGGCGGA ACGGGTAAAG AAGTGCGCTT CGGGCATCCT 



120 



TCCGGTACAT TGCGCGTCGG TGCAGCGCC3 AATGTCAGGA CGGACAATGG ACGGCCACCA 



180 



AAGCGGTTAT GAGCOGCAGC GCACGCGTGA TGATGGAAGG TTGGGTCAGG GTGCCGGAAG 24 0 



ATTGTTTTTA AATTGGACGG CGAACCGGTC TATTCGTATT GGCGTTATAC CGCCGCAAAG 



300 



GCAGACCTTG AAACTGGTGC GTGCCGTGCA GGGCATGTAC GGCTATGTGT GCGTGGCGGG 



360 



CGGATTTGAT GT3CGGAAT 



379 



(2) INFORMATIONS POUR LA SEQ ID NO: 94: 

(i) CARACTERISTIOUES DE LA SEQUENCE: 

(A) LONGUEUR: 308 paires de bases 
CB) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genoraique) 
(ili) HYPOTHETIQUE : NON 



(iv) ANTI-SENS: NON 
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(Xi) DESCRIPTION DE LA SEQUENCE: SEO & N0: 9 « '■ 
AATTTGTTGG GCAGATGGCC GTGAATCAGC AGGTGGGCGA CTTCTTCAAA CTCGCA7TTT 
TGTGCCAAAT CCAGAATGTC GTAACOGCGA TACGTCAAAT CGTTGCCGOT ACGCAACGGT 
ACACAAAGCG GTATTACCGG CCGCAACGCC AGAAAGCGCA ACGGATTTTT AGGTTTGAGG 
GTCGGGGTTT GAGTAGTTTC AGTCATGGTA TTTCTCCTTT GTGTTTTTAT GGGTTTCGGG 
T7TTCAGACG ACCGATGCGG ATTTGTTGAA AGGCAGTC7G AAAGCGGTAA ATCATTTTTG 
AAACAATT 

(2) INFORMATIONS POUR LA SEQ ID NO: 95: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 286 pa ires de bases 

(B) TYPE, nucleotide 

(C) NOMBRE DE BRINS: simple 
ID) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(iii) HYPOTHETIQUE: NON 

(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 95: 

AATTCGGAGC AGCA3TACCG CCAAGCGTTG CTCGCCTATT CCGGCGGTGA TAAAACAGAC 

GAGGGTATCC GCCTGATGCA ACAGAGOGAT TAOGGCAACT TGTCCTACCA CATCCGTAAT 

AAAAACATGC TTTTCATTTT TTOGGCAAGC AATGACGCAC AAGCTCAGCC CAACACAACT 

GACCCTATTG CCATTTTATG AAAAAGACGC TCAAAAAGGC ATTATCACAG TTGCAGGOGT 

AGACCGCAGT GGAGAAAAGT TCAATGGCTC CAACCATTGC GGAATT 

(2) INFORMATIONS POUR LA SEQ ID NO: 96: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 238 paires de bases 



60 
120 
130 
240 
300 
308 



60 
120 
180 
240 
286 
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13) TYPE: nucleotide 

(C) NOMBRE DE BR INS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE. ADN (genomique) 
( l i i ) HYPOTHETIQUE . NON 
(iv) ANT I -SENS : NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 96: 

AATTTGGATA CGTTGGAAAA GGGATATTTG ATTGGGAATG GGATGAAGAT AAGCGTAGAT 60 

GAGTTGGGGA AAAAAGTGTT AGAACATATC GGTAAGAATG AACCGTTATT GTTGAAAAAT 120 

CTACTGGTTA ACTTCAATCA GGGAAAACAT GAAGAAGTTA GGAAGTTGAT TTATCAGTTG 18C 

ATAGAGTTAG ATTTTCTGGA ACTTTTGTGA GGGATTCTAT GAAAAACTGG AAGCAATT 238 

(2) INFORMATIONS POUR LA SEO ID NO: 97: 

U) CARACTERISTIQUES DE LA SEQUENCE: 

;A) LONGUEUR. 322 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE : ADN (genomique) 
(in ) HYPOTHETIQUE : NON 
(iv) ANT I -SENS : NON 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 97: 
AATTCGGCAC GCAGGTTTTC TAAAAAAAGG CCGTTGATGA CTTTGTCGAT ATTGGCGGCT 
TCGGTGTAGT GCGCGCCCGC TTCGGCOGCT CTTGOGOGTC CATGACGGAT TGGAAGAGCG 
TGCCGAAGAT TTCTGGACTG ATGTTGOGCC AGTCGAAATT GCCGACAOGG GAGGAATACC 180 
TGCCAACAAG AGTGCAGGCA GCGTAATCAA ACCACCCCCA CCCGCAATCG CATCGATAAA 240 
TCCGGCAATC ATOGCAACCA AACCCAAAGC GAGTATTATG TATAAATCTT CCATGTTTCT 300 



60 
120 
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TAATCCTGTT AACTTGCACC AA 

(2) INFORMATIONS POUR LA SEQ ID NO: 98. 

(i) CARACTERISTIQUES CE LA SEQUENCE: 

(A) LONGUEUR 316 pa ires de bases 
(3) TYPE: nucleotide 

(C) NOMBRE DE BR INS : simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(111) HYPOTHETIC^: NON 

|iv) ANT I -SENS : NON 

[XI J DESCRIPTION DE LA SEQUENCE : SEC ID NO: 98 
AATTTGTCGG CAATCITCCC GGGTOGCTTT ATTTTGTGCA GGCATTATTT TTCATTTTTG 
GCTTGACAGT TTGGAGATAT TGTGTATCGG GGGGGGGTAT TTGCTGACGT AAAAAACTAT 
AAACGCCGCA GCAAAATATG GCTGACTATA TTATTGACTT TGATTTTGTC CTGCGOGGTG 
ATGGATAAAA TCGCCAGCGA TAAAGATTTG CGAGAACCTG ATGCOGGCCT GTTGTTGAAT 
ATTTTCGACC TGTAATTACG ATTTGGCTTC CGCGCCGGCA CAATATGCCG CCAAGCGGCG 
CCCACATTTT GGAAGC 

(2) INFORMATIONS POUR LA SEQ ID NO: 99: 

(ii CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 217 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(iii) HYPOTHETIQUE : NON 
(lv) ANTI-SENS: NON 



60 
120 
180 
240 
300 
316 
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(XI) DESCRIPTION DE LA SEQUENCE. SEO » ^ 99 ; 
AATTCGGACA GTATGAATAC AGCGGATTAA TACAAGCTAA GTTCATTACA ACGGAAAAAC 50 
CTTTAAAGAA TAATATGAAA GGTATTACCT TGTTTGCCAA OGGGAATGGT AAATATGCCC 120 
GAGTTTTTCA CTGAATAGCG AATCCAGCCA TTTCTATTCA TATTTGACTG GATGGCTGAA ISO. 
TGTGGACTTT ATAGATAA7G ACGATGAAGA TTTAATT 21 7 
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REVEND I CAT I ONS 
1/ ADN caracterises en ce qu'ii s'agit de tout 
ou partie de genes, avec leur phase de lecture, presents 
chez Neisseria meningitidis (designee ci-apres par Nm), 
5 mais absents soit chez Neisseria gonorrhoeae (designee 
ci-apres par Ng), soit chez Neisseria Pactamica (designee 
ci-apres par Nl ) a l f exception des genes impliques dans 
la biosynthese de la capsule polysaccharidique, frph, 
frpC, opc, porA, rotamase, de la sequence IC1106, des IgA 

10 proteases, de la pilline, de pilC, des proteines qui 
lient la transferrine et des prot6ines d'opacite.. 

2/ ADN selon la revendication 1, caracterises 
en ce qu'ils sont presents chez Nm, mais absents chez Ng. 

3/ ADN selon la revendication 2, caracterises 

15 en ce qu'ils comprennent une ou plusieurs sequence(s) 
telle(s) que prSsente(s) sur le chromosome de Nra Z2491 
entre tufA et pilT, ou region 1 du chromosome, et/ou la 
ou les s6quence(s) nucleotidique( s ) capable(s) de 
s'hybrider avec la ou lesdites sequences. 

20 4/ ADN selon la revendication 2, caract6ris6s 

en ce qu'ils comprennent une ou plusieurs s6quence(s) 
telle(s) que presente(s) sur le chromosome de Nm Z2491 
entre pilQ et /1740, ou region 2 du chromosome, et/ou la 
ou les sequence(s) nucleotidique( s ) capable(s) de 

25 s'hybrider avec la ou lesdites sequences. 

5/ ADN selon la revendication 2, caract6ris6s 
en ce qu'ils comprennent une ou plusieurs sequence(s) 
telle(s) que presente(s) sur le chromosome de Nm Z2491 
entre argT et opaB, ou region 3 du chromosome, et/ou la 

30 ou les s6quence(s) capable(s) de s'hybrider avec la ou 
lesdites sequences. 

6/ ADN selon la revendication 3, caracterises 
en ce que leur sfequence correspond, pour tout ou partie, 
a SEQ ID n* 9, 13, 22 ou 30, et/ou a toute s6quence se 

35 situant a plus ou moins 20 kb de ces SEQ ID sur le 
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chromosome d'une souche de Nm, et/ou est capable de 
s'hybrider avec au moins un fragment de l'une quelconque 
de ces sequences. 

7/ ADN selon la revendication 4, caracterises 
5 en ce que leur sequence correspond pour, tout ou partie, 
a SEQ ID n* 1, 2, 4, 6, 7, 10, 15, 31 ou 34, et/ou, a 
toute sequence se situant a plus ou tnoins 20 kb de ces 
SEQ ID sur le chromosome d'une souche de Nm, et/ou est 
capable de s'hybrider avec au moins un fragment de l'une 
10 quelconque de ces sequences. 

8/ ADN selon la revendication 4, caracterises 
en ce qu'il s'agit de tout ou partie de la sequence d' ADN 
SEQ ID N*36 ou de s6quences correspondant aux cadres 
ouverts de lecture SEQ ID N*37, SEQ ID N'38, SEQ ID N*39, 
15 SEQ ID NMO, SEQ ID N*41, SEQ ID N'42, SEQ ID N'43, SEQ 
ID N*44, SEQ ID N*45 et/ou a toute sequence se situant a 
plus ou moins 20 kb de ces SEQ ID sur le chromosome d'une 
souche de Nm, et/ou est capable de s'hybrider avec au 
moins un fragment de l'une quelconque de ces sequences. 
20 9/ ADN selon la revendication 5, caracterises 

en ce que leur sequence correspond, pour tout ou partie, 
a SEQ ID n' 8, 21, 23, 25, 26, 28, 29, 32 ou 35, et/ou, a 
toute sequence se situant a plus ou moins 20 kb de ces 
SEQ ID sur le chromosome d'une souche de Nm, et/ou est 
25 capable de s'hybrider avec au moins un fragment de l'une 
quelconque de ces sequences. 

10/ ADN selon la revendication 2, caracterises 
en ce que leur sequence correspond, pour tout ou partie, 
a SEQ ID n' 3, 5, 11, 12, 14, 16, 18, 19, 20, 24, 27 ou 
30 33, et/ou a toute sequence se situant a plus ou moins 20 
kb de ces SEQ ID sur le chromosome d'une souche de Nm, 
et/ou, est capable de s'hybrider avec au moins un 
fragment de l'une quelconque de ces sequences. 
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11/ ADN selon la revendication 1, caracterise 
en ce qu'ils sont communs avec ceux de Ng, ma i S S ont 
absents de chez Nl. 

12/ ADN selon la revendication 11, caracterise 
5 en ce qu'ils coraprennent une ou plusieurs sequence(s) 
telle(s) que presente(s) sur le chromosome de Nm Z2491 
entre arg J et reg F, ou region 4 du chromosome et/ou la 
ou les sequence(s) nucleotique ( s ) capable(s) de 
s'hybrider avec la ou lesdites sequences. 
10 *3/ ADN selon la revendication 11, caract^rises 

en ce qu'ils comprennent une ou plusieurs sequence* s) 
telle(s) que presente(s) sur le chromosome de Nm Z2491 
entre le marqueur lambda 375 a pen A, ou region 5 du 
chromosome et/ou la ou les sequence(s) nucleotique ( s ) 
15 capable(s) de s'hybrider avec la ou lesdites sequences. 

14/ ADN selon I'une quelconque des 
revendications pr6c6dentes, caracterise en ce qu'il code 
pour une prot6ine exportfee au-deia de la membrane 
cy toplasmique . 

20 15/ ADN selon l'une quelconque des 

revendications 1 A 14, caracterises en ce que tout ou 
partie de leur sequence correspond a une region conservee 
au sein de 1'espece Nm. 

16/ ADN selon l'une quelconque des 

25 revendications 1 a 15, caracterise en ce qu'il est insere 
dans un vecteur de transfert ou d' expression tel que 
cosmide, plasraide ou bacteriophage. 

17/ Cellule h6te, plus particulierement cellule 
bacterienne ou cellule de Nm, transform6e par 1 ? insertion 

30 d'au raoins un ADN selon l'une quelconque des 
revendications 1 A 15. 

18 /Cellule comportant des g6nes ou des 
fragments de genes spdcifiques de Nm, plus 
particulierement cellule bact6rienne, ou cellule de Nm, 

35 dont le chromosome est de!6t§ d'au moins un ADN selon 
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l'une quelconque des revendications 1 a 15, en 
particulier d'un ADN responsable de la pathogenicity. 

19/ ARN, caracterises en ce que leur sequence 
correspond pour tout ou partie a la transcription d'au 

5 moins une sequence ou fragment de sequence d'ADN selon 
l'une quelconque des revendications 1 a 15. 

20/ Acides nucleiques anti-sens, caracterises 
en ce que leur sequence correspond a 1' anti-sens d'au 
moins une sequence nucleotidique selon l'une quelconque 

10 des revendications 1 a 15 ou 19, ou d'un fragment d'une 
telle sequence, et qu'ils portent, le cas echeant, au 
moins une substitution chimique telle qu'un groupe 
methyle et/ou un groupe glycosyle. 

21/ Polypeptides, caracterises en ce qu'ils 

15 presentent un enchainement d' acides amines correspondent 
a tout ou partie d'une sequence telle que codee par les 
acides nucleiques definis dans l'une quelconque des 
revendications 1 a 15 ou 19, ou tel que deduit des 
sequences de ces acides nucleiques, avec, le cas echeant, 

20 des modifications par rapport aux sequences codees ou 
deduites des lors que ces modifications n'alterent pas 
les proprietes biochimiques telles qu'observees chez le 

polypeptide natif. 

22/ Peptides selon la revendication 21, 

25 caracterises en ce qu'il s'agit de peptides exportes au- 
dela de la membrane cytoplasmique, plus specialement de 
peprides correspondent a tout ou partie de ceux codes par 
un ADN selon la revendication 14. 

23/ Anticorps, caracterises en ce qu'il s'agit 

30 d' anticorps polyclonaux ou monoclonaux diriges contre au 
moins un epitope d'un peptide selon la revendication 20 
ou 21, ou de fragments de ces anticorps, plus 
particulierement les fragments Fv, Fab, Fab' 2, ou encore 
d'anti-anticorps capables de reconnaitre, selon une 
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reaction de type antigene-anticorps, lesdits anticorps ou 

leurs fragments. 

24/ Proced6 d'obtention de banques d'ADN 

Neisseria meningitidis-specifiques, comprenant : 

5 - le melange de deux populations d'ADN, 

- la realisation d'au moins une iteration 
d* hybridation-amplification soustractive, et 

- la recuperation du ou des ADN souhaites, 
suivie le cas echeant de leur purification avec 

10 1 • elimination des sequences redondantes. 

25/ Proced6 selon la revendication 24, 
caracterises en ce que pour obtenir une banque Nm 
specif ique par rapport & Ng 

- on melange deux populations d'ADN provenant 
15 respect ivement d'une souche de Neisseria meningitidis, ou 

souche de reference, pour laquelle la banque specif ique 
doit etre constitute, et d'une souche de Neisseria 
gonorrhoeae, ou souche de soustraction, les sequences 
d'ADN de ces souches etant telles qu'obtenues par 

20 . cisaillement aleatoire de 1 'ADN chromosomique 

de la souche de soustraction, notarament par passages 
repetes a travers une seringue, et 

. clivage de 1 f ADN chromosomique de la souche 
de reference, de preference par une enzyme de restriction 

25 produisant des fragments de taille inf6rieure a lkb 
environ, et que pour obtenir une banque d'ADN communs 
entre Nm et Ng, mais specif iques par rapport a Nl, on 
constitue trois banques diff6rentes, dont deux par 
digestion de l'ADN chromosomique de Nm par MBol et 

30 rsp5092, et la troisifeme, par digestion de 1 1 ADN 
chromosomique de Nm avec Mspl, on opere deux series de 
soustraction et on recupere les ADN presentant la 
specif icite recherchee. 
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26/ Banques de clones d'ADN relies qu'obtenues 
par mise en oeuvxe du precede selon la revendication 24 
ou 25. 

27/ Application du procede selon la 
5 revendication 24 pour l'obtention de banques d * ADN 
specif iques d'une cellule donnee ou d'un variant donne 
d'une meme espece de cellule, des lors qu'il existe une 
autre espece ou un autre variant proche genomiquement , 
et exprimant des pouvoirs pathogenes differents, en 
10 particulier de banques d'ADN specif iques de cryptocoques , 
d' Haemophilus, de pneumocoques ou encore d ' Escherichia. 

28/ Methode de diagnostic d'une infection 
raeningococcique, et plus particulierement de la meningite 
meningococcique, par mise en evidence de la presence de 
15 Neisseria meningitidis dans un echantillon biologique 
caracterisee en ce qu'elle comprend les etapes de : 

- mise en contact d'un echantillon biologique a 
analyser, avec un rfeactif elabore a partir d'au raoins un 
acide nucleique tel que defini dans l'une des 

20 revendications 1 a 15, ou 19, le cas echeant sous forme 
de sonde nucleotidique, ou d f amorce, ou en variante a 
partir d'au moins un anticorps, ou un fragment 
d' anticorps, tel que defini dans la revendication 23, 
dans des conditions permettant respectivement une 

25 hybridation ou une reaction de type antigene-anticorps, 
et 

revelation du produit de reaction 
eventuellement forme. 

29/ Methode de diagnostic d'une reaction 
30 immunitaire specif ique de 1' infection meningococcique, 
caracterisee en ce qu'elle comprend les etapes de : 

- mise en contact d'un echantillon biologique a 
analyser avec au moins un polypeptide selon l'une 
quelconque des revendications 21 ou 22 ou d'un anti- 

35 anticorps selon la revendication 23, ou d'un fragment de 
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celui-ci, ces produits etant, le cas echeant, marques 
dans des conditions permettant la realisation d'une 
reaction de type antigene-anticorps, et 

revelation du produit de reaction 
5 eventuellement forme. 

30/ Kits pour la mise en oeuvre d'une raethode 
selon l'une quelconque des revendications 28 ou 29, 
caracterises en ce qu'ils comportent : 

- au moins un r^actif tel que dfefini dans la 
10 revendication 28 ou 29, a savoir de type acide nucleique, 

anticorps ou peptide, 

- les produits, notamment marqueurs ou tampons, 
permettant la realisation de la reaction d 1 hybridation 
nucleotidique ou de la reaction immunologique visee, 

15 ainsi qu'une notice d 'utilisation. 

31/ Composition vaccinale incluant dans son 
spectre, en particulier en association avec au moins un 
vaccin pour l'enfance, une prophylaxie a visee anti- 
meningococcique , et destin^e a prevenir toute forme 

20 d f infection par Neisseria meningitidis, caracterisee en 
ce qu'elle comprend, en association avec un/des 
vehicule(s) physiologiquement acceptable( s ) , une quantite 
efficace : 

- de peptide selon la revendication 21 ou 22, 

25 ou 

- d* anticorps ou de fragment d* ant i- anticorps 
selon la revendication 23, 

ce materiel etant feventuellement conjugue, afin de 
renforcer son immunogenic! te, a une mol&cule porteuse 

30 telle que proteine de polyovirus, toxine tetanique, 
proteine issue de la region hypervariable d'une piline. 

32/ Composition vaccinale incluant dans son 
spectre, en particulier en association avec au moins un 
vaccin pour l'enfance, une prophylaxie a vis6e anti- 

35 meningococ^ique, et destinee a prevenir toute forme 
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Figure 2 
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Figure 8B 
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(57) Abstract 
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(57) Abrege* 
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DN As characterized in that they comprise one or more sequences such as those present in 
Neisseria meningitidis but absent from Neisseria gonnorheae, host cell, RNA, antisense 
nucleic acids, polypeptides, antibodies, diagnostic method, diagnostic kit and vaccinal 
composition thereof. 

2. Claims: 1 1-13 and 1,14-23, 28-32 partly 

DNAs characterized in that they comprise one or more sequences such as those present in 
neisseria meningitidis but absent from Neisseria lactamica, host cell, RNA, antisense nucleic 
acids, polypeptides, antibodies, diagnostic method, diagnostic kit and vaccinal composition 
thereof. 

3. Claims: 24-27 

Method of obtaining specific DNA banks neisseria meningitidis comprising the mixture of a 
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DNA clone banks and the applications thereof. 
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ADNs caracterises en ce qu'il comprennent une ou plusieurs 
sequence(s) tell(s) que presente(s) chez Neisseria 
meningitidis mais absente(s) chez Neisseria lactamica , 
cellule note , ARN , acides nucleiques anti- sens 
polypeptides .anticorps . methode de diagnostic, kit de 
diagnostic , et composition vaccinale corrsepondants . 



3. revendications: 24-27 

precede d'obtention de banques d?A0N Neisseria meningitidis 
specifiques comprenant le melange d'une population de 
Neisseria meningitidis , avec une population de Neisseiria 
gonnorheae, soit de Neisseria lactamica , banques de clones 
d'ADN et leurs applications correspondantes . 
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